導航:首頁 > 研究方法 > 人類基因組分析方法

人類基因組分析方法

發布時間:2022-11-29 17:54:59

Ⅰ 人類基因組計劃的內容是什麼

人類基因組這個研究,第一次在生命科學裡面實現了整體上的遺傳信息的解析,基因組功能的研究。基因組就是一個生命體的遺傳信息的總和。

生命信息的儲存單位,實際上就是我們說的基因,載體是脫氧核糖核酸 DNA。在多細胞的生物里,不同的細胞之間,由不同的 細胞所組成的組織之間,由不同的組織所形成的器官之間都在發生信息的流動。這個就是我們所說的:遺傳學的中心法則。基因組就是一個生命體的遺傳信息的總和。DNA雙螺旋的發現大概是20世紀生命科學最最偉大的突破。ATCG四種不同的鹼基構成了紛繁復雜的遺傳學語言。

實際上絕大多數的人類疾病都是多基因控制的。人類基因組計劃正式啟動是1990年,就是要用15年的時間,到2005年完成人類基因組DNA全序列的測定。到今天為止我們也還沒有這樣的技術,說拿來一條染色體,我們就能直接測序。所以整個人類基因組計劃實際上就是由復雜到簡單,再由簡單又回歸復雜的一個過程。在人類基因組測序起步的時候,當時用的DNA序列的分析方法是凝膠電泳為主的方法,基本上還是手工運作的。但是在20世紀90年代以後,新的一個測序技術產生了就是毛細管電泳儀技術。使得測序的速度大大加快。一天就可以有100萬個鹼基對的的序列被測出。中國也加入這一個測序計劃,我們承擔了1%的任務。2000年4月份,21號染色體全序列測序草圖完成了。

現在我們已經可以做到在指甲蓋大小的生物晶元上點上人類的基因組,所有的基因都點在上面。將來要去看病,不光要帶病卡,還要帶一個自己的晶元。醫生用葯診斷之前,用晶元看看你可能得什麼病。通過對進化不同階段的生物體基因組學的比較,就可以發現基因組結構組成的功能調節的規律。實際上人類疾病相關的基因,也恰恰是人類基因組結構和功能完整性至關重要的信息。實際上在過去幾年當中,對疾病的研究早已成為人類基因組研究

一個重要計劃的組成部分。1997年提出了兩個計劃:一個是腫瘤基因組的解剖計劃,還有一個叫環境基因組計劃。實際上都是和健康相關的。人類基因組計劃對醫學的貢獻,一個是在診斷方面,另外是在基因治療方面。對於我們這樣發展中國家來說,更應該注重預防。

我們國家的基因組計劃,是1994年開始啟動的,從功能基因組的角度進行切入。採取結構與功能並重,多學科交叉建立關鍵技術,進行基因組多樣性和疾病基因研究。這是我們一開始的時候一個策略。我們可以很自豪的說:現在除了Y染色體,所有的染色體上面都遍布著中國科學家發現和命名的基因。最近我們啟動了一個中華民族基因組-SNP的大規模的研究。這個工作從群體遺傳學轉向了,我們中國人群特點的、疾病發生發展的遺傳學信息的研究。所以,如果現在我們能夠把中華民族生命元素變異的系統目錄和資料庫做出來的話,就能夠獲得我國生物醫學界和制葯工業界技術創新的知識產權來造福子孫後代來貢獻於全人類。

全文

當然清華是我們國家最高等的學府之一了。所以,今天到這里來,也有點誠惶誠恐。那麼主要是來求教的。現在我要給大家介紹的人類基因組這個研究,可以說是第一次,在生命科學裡面,實現了某種大科學的概念。也就是說來一個整體上的遺傳信息的解析,基因組功能的研究。所以我說現在生物學的特點,已經從70年代、80年代,主要是以分析為主,學科的精細化,分工的細化,這樣一個趨勢到了一個新的平台上面。這個平台就是大綜合,其實我們中國的科學,一開始就是講究大綜合。你看我們的藝術也是這樣,我們的寫意畫就是一種大綜合。這個東西方的融合非常重要,把西方嚴謹的分析,和中國早在幾千年前的大綜合的思路結合在一起的話,我想有可能帶來一些新的突破的機遇。那麼這張圖我想,恐怕不光是搞生命科學的,就是我們非生命科學的同學們,也都是非常熟悉的,遺傳學中心法則。

我們都知道,生命活動它的本質,它是一個信息的流動。有人一直說,我們都是搞生命科學的。但是突然有一個冒出一句話:「什麼是生命」?這個倒可以讓人思索一番。我個人體會,生命信息它的儲存單位,生命的重要特點之一,它有記憶功能。那麼它的儲存的單位,實際上就是我們說的基因,在絕大部分的生命體我們知道,它的載體是脫氧核糖核酸DNA。但是它的執行單位,主要來說是蛋白質。這裡面它用信息的語言,不是一樣的,一個是核酸的語言,一個是氨基酸的語言。所以在這個空間信息的流動,需要有一些調控的機制。這個調控大家知道,第一步就是轉錄。這個時候生命信息的語言,沒有發生變化,都是核酸的語言。只是從DNA到了MRNA上面,這個過程我們稱為轉錄。然後語言要發生變化,發生轉換,要求來進行翻譯了。所以從MRNA上面的生命語言,變成蛋白質的生命語言。當然我們知道這個蛋白質,很多的蛋白質它都具有代謝的活動。生命體和非生命體的重要差別之一就是有代謝和新陳代謝,然後蛋白質可以形成高級空間的構型。那麼在這個裡面,細胞的不同的部分互相之間作用,細胞核和細胞漿互相在作用。然後在多細胞的生物里,不同的細胞之間、由不同的細胞所組成的組織之間、由不同的組織所形成的器官之間都在發生信息的流動。我想這個就是我們所說的「遺傳學的中心法則」。那麼基因這個概念,大家都很清楚了或者說基本概念很清楚,確切的定義也許今天還不是非常清楚。

那麼基因組是什麼意思?基因組就是一個生命體的遺傳信息的總和。那麼在這里我們就不是單個基因,而是所有的基因。它所編碼所有的氨基酸相互之間的這個關系,所以感官性是完全不一樣的。DNA雙螺旋結構的發現大概是20世紀生命科學最最偉大的突破。那麼A、T、C、G四種不同的鹼基,構成了紛繁復雜的遺傳學語言,生命信息的最基本的符號。這個最基本的符號實在是讓我們感到非常簡單。大自然就用這四種簡單的字元,組成了讓我們嘆為觀止的大千世界的無數生命的多樣性的現象。那麼它的遺傳信息,在絕大多數的生命體,我剛才說的是DNA的分子。那麼它的排列組合在那裡就決定了,或者說在相當大的程度上決定了生命活動在人體,也就是我們講的:生、老、病、死等等這些活動。那麼我們在講雙螺旋結構的時候,我們都知道,鹼基對、DNA是生物的大分子。一般來說我們不是用一個質量單位來表示它的體量,而是用它的長度。那麼一個bp,中文叫一個鹼基對。但是在基因來說,一個基因常常是要成千上萬個鹼基對。所以我們引入了「千鹼基對」這樣的尺度。然後再做到基因組的時候,我們都知道基因組它是非常大的尺度,所以又發明了一些新的尺度單位,像Mb指的是百萬鹼基對。

這個是基因組計劃之前的,我們對人類基因組的一些了解。我們知道人類基因組的長度,一個單倍體的基因組的長度大概是30億個鹼基對。一般的教科書上都說,序列當中編碼序列,也就是說我們剛才說的,發生轉錄表達的,可以被稱之為基因的序列。大概實際上是指成熟的MRNA,發生加工以後的MRNA當中的序列,大概小於5%。也就是說,非編碼序列佔了絕大多數。在人體細胞核裡面,遺傳信息它是以染色體的方式進行組織的,分布於22個常染色體和2條性染色體。我們都知道以前的生物科學的特點,基本上是師傅帶徒弟、作坊式的操作。那麼到了80年代中期的時候,我想一個是生命科學的這個科學思維的大大擴展,第二個是技術的這個進步。比方說當時遺傳工程已經非常成熟了,當時DNA測序也相對成熟,然後PCR的技術在那裡開始產生了。因此使得科學家們,生命科學家們的雄心壯志,在那裡萌發了,決心要沖破原來的這種作坊式的被物理學界甚至化學界不太看得起的那種運作方式,搞一點可以稱為是大科學的東西。

當然我想科學研究的條件,思維這是一個方面。但是實際上回顧一下科學史的話,很多重大的事件它還是需求在那裡拉動的。我們有的科學家批評這樣的做法,意思是說我們要注意把基礎研究和社會重大需求結合在一起。我覺得實際上這有點失之偏頗的,就是說有各種各樣類型的研究:有的是一種自由的探索,那麼這個可以非常小心,一個人的腦瓜里都可以產生諾貝爾獎的構思。但是也有一些研究的確是希望能夠造福人類的。但是這樣的研究提出的挑戰,實際上又可以孕育著不知道多少人的諾貝爾獎的思想在裡面。那麼人類基因組計劃,就是這樣一個典型。

我們看第一份,可以認為是正式的標書。我們做這個課題,一般來說首先要有標書。那麼人類基因組計劃的第一個標書,可以被認為是諾貝爾獎獲得者Dulbecco 1986年發表在《科學》雜志的一篇短文。它的這個短文的題目是什麼呢?《腫瘤研究的轉折點——人類基因組研究》。事實上我們知道美國有一位雄心勃勃的年輕總統肯尼迪上台以後,當時他在科學上有兩大計劃:一個是實現人類登月,還有一個戰勝癌症。那麼人類登月隨著阿波羅計劃的比較順利地實施,1969年人類實現了登月。但是攻克腫瘤的計劃是一個失敗的。為什麼?原來科學家把問題想得太簡單了,以為腫瘤就是一兩個基因的問題。但實際上絕大多數的腫瘤,都是多基因的問題。它涉及的面是整個基因組的問題,是遺傳信息的整體上面紊亂的這樣一些問題。就是剛才講的,我們不要以為好像一個融合基因打到小鼠裡面去,就足以引起一個白血病,不是那麼簡單的。因為如果那樣的話,你一打進去就要產生白血病,事實上我們PML羅拉白血病,在受精卵裡面注射進這個融合基因以後,需要等待一年的時間才會出現白血病而且不是每一個小時都會發生白血病。所以就提示有其他的決定因素在裡面。我們現在知道有時候幾個基因一起傳染的時候,它發生白血病的速率就會大大加快。

Dulbecco這個文章它就說,如果我們想更多地了解腫瘤,我們從現在開始必須關注細胞的基因組。從哪那個物種著手努力?如果我們想理解人類腫瘤,那就應該從人類開始。人類腫瘤研究將因對DNA的詳細知識而得到巨大的推動。實際上絕大多數的人類疾病都是多基因的。人類基因組計劃正式起動,現在一般的說法是1990年。那麼1990年因為是美國國會通過了正式啟動這樣一個計劃。這個計劃雄心勃勃就是要用15年的時間,到2005年完成DNA的全序列的測定。這個投資量是多少呢?30億美元。當時計算的依據是測一個鹼基對大概需要一美元。整個計劃在這個地方實際上是一個比較狹義的一個計劃,這個計劃實際上就是一個測序計劃。實際上我們講測序,讀出天書只是理解人類自身的第一步,最重要的是讀懂天書。但是即使是這樣讀出天書一個計劃的話,它也要經歷很多的磨難,很多的困難。也就是說,到今天為止,我們還沒有這樣的技術說,拿來一條染色體,我們就能夠直接測序,從一頭測到另外一頭我們沒有辦法這樣做。所以整個人類基因組計劃,實際上可以簡單地說就是由復雜到簡單再由簡單又回歸復雜,最後大概還是回歸到簡單。也就是說把不能直接測序的一條染色體拿來給它進行分解,分解成比較小的可以操作的這樣的單位。那麼怎麼分解呢?那就是作圖,你可以用遺傳學的方法去作圖,也可以用物理學的方法來作圖。我們知道遺傳學作圖,就是利用遺傳學的標志來確定DNA標志間相對的距離。另外一個概念就是說要構成一些所謂的DNA連續的克隆系,那麼這些片斷,它互相之間重疊,它可以覆蓋整個的染色體,從一端覆蓋到另外一端。這樣就把一個不能直接拿來測序的單位,就給它解析成比較小的、可以操作的這樣一個單位。最後給它重新組合成忠實於原來染色體裡面生命信息這個排列的,這樣一個狀況在這裡面,識別全部的人類基因。所以人類基因組就是作圖,或者狹義的人類基因組計劃,就是作圖的計劃,遺傳圖、物理圖、序列圖,然後基因圖。

在人類基因組計劃進行大規模測序的策略有兩種,一種就是我剛才說的那種思路,實際上叫逐個克隆。我剛才說了,你把DNA克隆的連續克隆系建起來了,覆蓋整條染色體了,然後你就把一個一個的克隆,用得最多的就是叫BAC--細菌的人工染色體,大概100多個KB這樣的長度。那麼把這個克隆一個一個挑出來,挑出來以後再進行亞克隆。這種亞克隆就是這樣的,就可以測序了,測序以後再給它組裝起來、還原起來。這樣一個策略,是國際上公共領域的測序計劃所採取的策略。實際上它是歷史的沿革,就是說從作圖,遺傳、物理作圖演化過來的。我們都知道美國的瑟拉爾公司,也知道奎克曼特。那麼它搞了一個叫全基因組鳥槍法,在一定作圖信息基礎上,繞過大片段連續克隆系統的構建而直接將基因組分解成小片段隨機測序,然後利用超級計算機來進行組裝。能夠使得人類基因組,在初步完成作圖以後,很快地邁入到測序,尤其是大規模測序。並且使得整個進度朝向人們的預期。這裡面有兩個重大因素的貢獻,不得不承認這裡面,工業界的貢獻是非常大的。比如說在人類基因組起步的時候,當時用的這個DNA序列的分析方法,還是凝膠電泳儀為主的方法,基本上還是手工運作的。但是在20世紀90年代上半段的時間裡面,新的一個測序技術出現了,毛細管電泳儀。另外把自動化的運作和包括工業界的管理這種系統,都引進來。所以使得測序的速度大大加快。你像這樣一個測試儀,它的名字就叫做Megabace。什麼意思?就是毛細管電泳,它差不多兩小時就可以進行讀出一個序列,大概能夠讀到幾百個鹼基,那麼它一天可以做十班,那麼它是96道,所以一天可以做960道。每一道按照他們的宣傳,都可以達到一個KB的話,實際上是很難做到的,這是最理想的狀態下。所以一天就可以有100萬個鹼基對的產出。但是曾經使學術界感覺比較困惑的另外一個問題,就是說如果我們現在處於一個知識爆炸的這樣一個時代,可以說生物信息的爆炸,是最最給人印象深刻的。

我們看在基因組計劃起步之前,在公共資料庫里邊DNA序列增長非常緩慢。然後1990年以後,就是指數增長期。而且這個東西我是統計到去年、2000年兩家世界的公共領域,測序計劃和瑟拉爾分別宣布完成了所謂的工作草圖。這個時候是這樣一個情況,現在大概是這樣的情況。1999年當時面對著瑟拉爾的強行挑戰,它是1998年成立的,號稱三年要拿下人類基因組,國際人類基因組計劃決定迎接挑戰。就由國際上16個組,分擔了人類基因組測序的任務,中國也加入這樣一個測序計劃。當然我們承擔的是1%的任務,1%還是很重要的。因為對於一個發展中的國家來說,能夠擠入到這種屬於發達國家的俱樂部裡面,應該說還是很不容易的。有些事情我們想擠也不一定擠得進去的,像空間站的計劃,人家還防範你。

在這里我想介紹一下什麼叫工作框架圖?因為都在說工作框架圖,什麼叫工作框架圖?其實就是一個工作草圖。那麼它的意思呢?就是說通過對染色體位置明確的BAC(細菌人工染色體)連續克隆系4—5倍覆蓋率的測序,獲得基因組90%以上的基因序列,其錯誤率應該低於1%。也就是說你的覆蓋面要達到基因組的90%以上。第二個呢,錯誤率應該低於1%。100個鹼基對立面允許你有一個以下的鹼基對的錯誤。雖然這只是一張草圖,但是它已經有用途,就是對基因組結構的基本認識,基因的識別和解析、疾病基因的定位克隆、單個核苷酸的多態性的發現等。

那麼講到草圖就一定有一個最終完成圖了,所以這張圖的定義,要求測序所用的克隆能忠實地代表常染色質的基因組結構,覆蓋率要達到99.9%以上,然後序列的錯誤率應該低於萬分之一。與工作框架圖的關系呢,實際上就是在工作框架圖的基礎上再加大測序的覆蓋率,填補空隙,使得序列的精度增加,能夠達到這樣一個標准。也就是說,它是草圖的下一步。2000年6月25號,當時的測序的情況是怎麼樣的呢?我們看當時在公共領域就是說各國政府支持的六各國家,美國、英國、德國、日本、法國、中國,六國政府支持的公共領域的計劃,當時是覆蓋了大概人類基因組的86.8%。其中包含一部分已經完成,就是我們剛才說的最終序列圖這樣標準的序列大概是20%多一點點,然後66%左右的序列處於所謂的工作草圖這樣的階段。那麼也可以說,還沒有完成。因為我們說要達到90%以上,但是同時瑟拉爾他號稱他的覆蓋率已經超過了95%。當然他的覆蓋率其實包括了所有的公共領域的這個貢獻,再加上他的貢獻,所以兩者相加起來。我想我們應該相信大概90%以上的序列,都是被工作草圖以上的這樣一個序列的質量所覆蓋著。我們看看公共領域測序計劃當時的情況,在24條染色體上分布的情況。我們知道,實際上1999年12月份,22號染色體作為人類最小的染色體之一,它的全序列被測定,或者說是它的常染色體,指部分的全序列。我們注意到它的短臂這個地方,就是易染色體區域,實際上非常難測。因為都是大量的空序列,又沒有多少基因。2000年4月份21號染色體全序列完成了,也是同樣的定義,就是說常染色體的這個部分。我們看這里是用深紅的顏色來表示,差不多就是最終完成的。而這種黃顏色表示的是我們剛才說的工作草圖,在大部分染色體區域,是工作草圖部分。實際上現在我們講的,完成人類基因組全序列的測定,都是指的常染色體部分,所以有的人說也許人類基因組序列永遠也不能被結束。

2001年2月15日,我們知道公共領域在《自然》上,都是有一種分庭抗禮的,兵對兵、將對將的感覺。2月16號就登了瑟拉爾序列,顯然,經過新的一輪角逐,比2000年6月份的時候,完成序列的質量又要高得很多。所以這樣的話,應該認為,兩家加在一起的信息,應該說比我剛才說的一般的定義又要進一步了。所以就產生了一個在工作草圖和最終完成圖之間的一個中間狀態,這個中間狀態就叫做高質量的草圖。但是就是這樣一個高質量的草圖,讓我們已經基本上知道我人體生命信息的家當到底有多大。弄到最後我們發現我們的家當好像還是比較可憐的,比我們原來的想像,因為我們的基因數量大概只有線蟲,只有900多個細胞的一個生命體的大概一倍左右,我們就比那麼一個小蟲多一倍。從低等生物到高等生物它的基因組的復雜度,與其說是由基因的數量來決定的,還不如說更主要的是由基因的長度來決定的。我們最近完成了一個細菌的測序,叫鉤端螺旋體,可以引起傳染病的。它平均一個KB就有一個基因,這么小的一個東西,500萬個鹼基對的一個基因組,有5000個基因。我們人30億個鹼基對,我們不過就3萬個,頂多接近4萬個這樣一個數字。但是你看到了酵母,到了真核細胞的話,那它就是平均大概5到10個KB一個基因。然後到了果蠅的話,雖然它的基因數量好像還沒有線蟲的多。但是它的基因長度已經達到10個KB以上,然後到了哺乳類一個基因,大概像人類現在是100多個KB才有一個基因。所以替換、剪接這種可能性就大大增加了。另外跟時間和空間,也就是發育階段和組織特異性表達的調控相關這些序列復雜大大增加了。雖然基因在高等生物可以達到十的五次方數量級,幾萬到十萬個這樣的比較高等的生物。但是實際上它的蛋白質的結構域,實際上如果把基因組比成一個大廈的話,組成這個大廈的預製件,這個數量實際上是比較有限的。那麼另外有一些高級生物中有更為豐富的結構域組合,神經功能、組織特異發育、調控、止血和免疫系統的基因,在脊椎動物大量擴展。數以百計的人類基因源於脊椎動物進化過程中某個時間點上,細菌基因的橫向轉移。基因組在不同個體之間差異很大——單核苷酸多態性,單倍體的基因差異為1/1250,能夠導致蛋白質變異的不到1%。

這本遺傳天書,已經放在我們面前了,接下來就是要讀懂它。要讀懂它,一定要從大的系統的概念來考慮怎麼樣讀懂。一個這個基因組的信息,和外界的環境,是在那裡相互作用。另外這個基因組的信息不是從天上掉下來的,它是通過一個漫長的幾十億年進化的過程發展過來的,所以要用比較的方法去讀它。另外要考慮到在個體之間和群體之間又是有變異的,這種變異也受到外界環境的一些調節。所以功能基因組學的研究內容,雖然現在沒有一個嚴格的定義,但是我個人認為,至少包括這幾個方面:人類基因組DNA序列變異性研究,其核心的內容是SNP,因為這是最常見的變異類型,當然還有很多其他的變異。然後基因組表達調控的研究,這個是發育階段組織器官的變異,然後模式生物體的研究,這個裡麵包括進化的意思,和利用模式生物進行功能研究。當然從事所有這些研究,就像我們進行測序研究一樣。生物信息學,它既是一個基本的工具,又是一個新興的學科。因為最後要把這些信息整合起來,搞成一個我們所說的,系統生物學的話,你一定要用理論的手段,和大規模信息處理的手段。

那麼基因組DNA序列變異性的研究,SNP,這種變異類型實際上是所有基因組的共同特徵。它在相當大的程度上決定了不同的個體群體,這個是指的人類在疾病的易感性,對環境致病因子反應性和其他性狀上面的差別。

在這里我舉一個例子,說明這個性狀有多麼重要。我們就來看一看,我們對葯物的反應性。我想我們每一個人、再健康的人,一生當中總要接觸一些葯物的。現在有一個新的提法叫葯物遺傳學,指的是大部分葯物,在體內代謝的酶會有遺傳多態性。像這里,一類是改變基團的一些酶,一類是對基團進行轉移的一些酶。它都有很多的多態性,這種多態性的後果是什麼呢?它在相當大的程度上決定了我們個體對葯物的反應性。比方說這是一個很復雜的程序,但是我想我們主要的信息在這個地方。對於某一個葯物來說,最適合它的基因型的,它的療效可以達到75%,毒性只有1%。同樣一個葯,如果到了一個最不適合它的一個個體的情況是怎麼樣?它的療效只有10%,毒性大於80%。那麼基因組表達以及表達的調控的這個研究,這個我想都可以理解。那麼指的是在全細胞的水平,如果是在單細胞的生命體是整個生命體的水平,識別基因組的所有轉錄表達的產物。實際上它是高通量的結構生物學,大批量解析蛋白質的高級結構,是連接基因組功能研究和新葯開發研究的橋梁。然後為了在這樣大的規模上,在整體水平上獲得功能信息,需要一些所謂的並行化的分析手段。就是現在已經做得到在指甲蓋大小的生物晶元上點上人類的基因組,所有的基因都點在上面。所以有人說將來要去看病不光要帶病卡,還要帶一個自己的晶元。醫生用葯診斷之前先把晶元插進去,看看你可能得什麼病,說起來很好,也很嚇人的。模式生物體的研究一般的說法大概從單細胞、第一個生命跟外界隔絕以後,到現在的萬物之靈的人類,大概是14億年的進化史。那麼通過進化不同階段的生物體基因組序列的比較,發現基因組結構組成和功能調節的規律。

那麼基因組計劃,我剛才說一個是科學興趣使然,科學家要探索人類的自身,另外也是社會驅動使然,就是說要戰勝人類的疾病。所以最後它的價值的實現,我想還是應該回歸到對人類的健康的貢獻上面去。那麼在這個意義上說,人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的信息。我們看到過去的十年當中,由於人類基因組研究的帶動,使得人類疾病相關性的研究有了長足的進步。單基因疾病由於定位克隆和定位候選克隆的新思路,導致了一大批遺傳病基因的發現。我們知道傳統的對基因的認識,是從表型到基因型。也就是你知道一個蛋白質,你測定了它的氨基酸的序列,然後根據密碼址的原理,你推測它的DNA的序列可能是什麼。你合成一個探針到基因組當中一調,把基因調出來。比方說血紅蛋白病,這是第一個人類發現的分子病,它就是先知道了豬蛋白氨基酸的序列,然後再把它的基因調出來。但是絕大多數的人類疾病,我們不知道它的生化基礎是什麼東西,特別是在基因組計劃之前。比方說像亨氏舞蹈病,我們就知道這個人會手舞足蹈,叫亨氏舞蹈病。比方說像遺傳性的結腸癌,我們知道大腸部位大容易長息肉,但是我們不知道那個蛋白質出了問題。你怎麼辦?怎麼來找到它的疾病基因?所以有了一個新的概念,叫反過來的遺傳學,是什麼呢?先去找它的基因,然後再去看它的表型。一旦拿到基因以後,很容易你馬上可以推測它的蛋白質的結構。你可以產生抗體,你可以接下來做很多基因的功能。健康相關的研究是HGP的重要組成部分,1997年相繼提出:腫瘤基因組的解剖計劃,環境基因組計劃。

人類基因組計劃對醫學的貢獻。基因診斷,基因治療和基因組信息為基礎的治療,發展中國家和發達國家越來越重視疾病的預防,特別是基於基因組信息的疾病預防。我國一貫提倡的是預防為主。如果能夠在一個人剛出生的時候進行疾病易感基因的識別,在早期把風險人群挑出來,然後在環境因子、生活方式上實施干預。生物技術發生了深刻的變化,更多地進入到細胞、胚胎和組織的研究水平上來,推動了胚胎和成年期幹細胞技術的應用。血液病研究與其他先進學%

Ⅱ 人類基因組計劃的主要任務是什麼

人類基因組這個研究,第一次在生命科學裡面實現了整體上的遺傳信息的解析,基因組功能的研究。基因組就是一個生命體的遺傳信息的總和。

生命信息的儲存單位,實際上就是我們說的基因,載體是脫氧核糖核酸 DNA。在多細胞的生物里,不同的細胞之間,由不同的 細胞所組成的組織之間,由不同的組織所形成的器官之間都在發生信息的流動。這個就是我們所說的:遺傳學的中心法則。基因組就是一個生命體的遺傳信息的總和。DNA雙螺旋的發現大概是20世紀生命科學最最偉大的突破。ATCG四種不同的鹼基構成了紛繁復雜的遺傳學語言。

實際上絕大多數的人類疾病都是多基因控制的。人類基因組計劃正式啟動是1990年,就是要用15年的時間,到2005年完成人類基因組DNA全序列的測定。到今天為止我們也還沒有這樣的技術,說拿來一條染色體,我們就能直接測序。所以整個人類基因組計劃實際上就是由復雜到簡單,再由簡單又回歸復雜的一個過程。在人類基因組測序起步的時候,當時用的DNA序列的分析方法是凝膠電泳為主的方法,基本上還是手工運作的。但是在20世紀90年代以後,新的一個測序技術產生了就是毛細管電泳儀技術。使得測序的速度大大加快。一天就可以有100萬個鹼基對的的序列被測出。中國也加入這一個測序計劃,我們承擔了1%的任務。2000年4月份,21號染色體全序列測序草圖完成了。

現在我們已經可以做到在指甲蓋大小的生物晶元上點上人類的基因組,所有的基因都點在上面。將來要去看病,不光要帶病卡,還要帶一個自己的晶元。醫生用葯診斷之前,用晶元看看你可能得什麼病。通過對進化不同階段的生物體基因組學的比較,就可以發現基因組結構組成的功能調節的規律。實際上人類疾病相關的基因,也恰恰是人類基因組結構和功能完整性至關重要的信息。實際上在過去幾年當中,對疾病的研究早已成為人類基因組研究

一個重要計劃的組成部分。1997年提出了兩個計劃:一個是腫瘤基因組的解剖計劃,還有一個叫環境基因組計劃。實際上都是和健康相關的。人類基因組計劃對醫學的貢獻,一個是在診斷方面,另外是在基因治療方面。對於我們這樣發展中國家來說,更應該注重預防。

我們國家的基因組計劃,是1994年開始啟動的,從功能基因組的角度進行切入。採取結構與功能並重,多學科交叉建立關鍵技術,進行基因組多樣性和疾病基因研究。這是我們一開始的時候一個策略。我們可以很自豪的說:現在除了Y染色體,所有的染色體上面都遍布著中國科學家發現和命名的基因。最近我們啟動了一個中華民族基因組-SNP的大規模的研究。這個工作從群體遺傳學轉向了,我們中國人群特點的、疾病發生發展的遺傳學信息的研究。所以,如果現在我們能夠把中華民族生命元素變異的系統目錄和資料庫做出來的話,就能夠獲得我國生物醫學界和制葯工業界技術創新的知識產權來造福子孫後代來貢獻於全人類。

全文

當然清華是我們國家最高等的學府之一了。所以,今天到這里來,也有點誠惶誠恐。那麼主要是來求教的。現在我要給大家介紹的人類基因組這個研究,可以說是第一次,在生命科學裡面,實現了某種大科學的概念。也就是說來一個整體上的遺傳信息的解析,基因組功能的研究。所以我說現在生物學的特點,已經從70年代、80年代,主要是以分析為主,學科的精細化,分工的細化,這樣一個趨勢到了一個新的平台上面。這個平台就是大綜合,其實我們中國的科學,一開始就是講究大綜合。你看我們的藝術也是這樣,我們的寫意畫就是一種大綜合。這個東西方的融合非常重要,把西方嚴謹的分析,和中國早在幾千年前的大綜合的思路結合在一起的話,我想有可能帶來一些新的突破的機遇。那麼這張圖我想,恐怕不光是搞生命科學的,就是我們非生命科學的同學們,也都是非常熟悉的,遺傳學中心法則。

我們都知道,生命活動它的本質,它是一個信息的流動。有人一直說,我們都是搞生命科學的。但是突然有一個冒出一句話:「什麼是生命」?這個倒可以讓人思索一番。我個人體會,生命信息它的儲存單位,生命的重要特點之一,它有記憶功能。那麼它的儲存的單位,實際上就是我們說的基因,在絕大部分的生命體我們知道,它的載體是脫氧核糖核酸DNA。但是它的執行單位,主要來說是蛋白質。這裡面它用信息的語言,不是一樣的,一個是核酸的語言,一個是氨基酸的語言。所以在這個空間信息的流動,需要有一些調控的機制。這個調控大家知道,第一步就是轉錄。這個時候生命信息的語言,沒有發生變化,都是核酸的語言。只是從DNA到了MRNA上面,這個過程我們稱為轉錄。然後語言要發生變化,發生轉換,要求來進行翻譯了。所以從MRNA上面的生命語言,變成蛋白質的生命語言。當然我們知道這個蛋白質,很多的蛋白質它都具有代謝的活動。生命體和非生命體的重要差別之一就是有代謝和新陳代謝,然後蛋白質可以形成高級空間的構型。那麼在這個裡面,細胞的不同的部分互相之間作用,細胞核和細胞漿互相在作用。然後在多細胞的生物里,不同的細胞之間、由不同的細胞所組成的組織之間、由不同的組織所形成的器官之間都在發生信息的流動。我想這個就是我們所說的「遺傳學的中心法則」。那麼基因這個概念,大家都很清楚了或者說基本概念很清楚,確切的定義也許今天還不是非常清楚。

那麼基因組是什麼意思?基因組就是一個生命體的遺傳信息的總和。那麼在這里我們就不是單個基因,而是所有的基因。它所編碼所有的氨基酸相互之間的這個關系,所以感官性是完全不一樣的。DNA雙螺旋結構的發現大概是20世紀生命科學最最偉大的突破。那麼A、T、C、G四種不同的鹼基,構成了紛繁復雜的遺傳學語言,生命信息的最基本的符號。這個最基本的符號實在是讓我們感到非常簡單。大自然就用這四種簡單的字元,組成了讓我們嘆為觀止的大千世界的無數生命的多樣性的現象。那麼它的遺傳信息,在絕大多數的生命體,我剛才說的是DNA的分子。那麼它的排列組合在那裡就決定了,或者說在相當大的程度上決定了生命活動在人體,也就是我們講的:生、老、病、死等等這些活動。那麼我們在講雙螺旋結構的時候,我們都知道,鹼基對、DNA是生物的大分子。一般來說我們不是用一個質量單位來表示它的體量,而是用它的長度。那麼一個bp,中文叫一個鹼基對。但是在基因來說,一個基因常常是要成千上萬個鹼基對。所以我們引入了「千鹼基對」這樣的尺度。然後再做到基因組的時候,我們都知道基因組它是非常大的尺度,所以又發明了一些新的尺度單位,像Mb指的是百萬鹼基對。

這個是基因組計劃之前的,我們對人類基因組的一些了解。我們知道人類基因組的長度,一個單倍體的基因組的長度大概是30億個鹼基對。一般的教科書上都說,序列當中編碼序列,也就是說我們剛才說的,發生轉錄表達的,可以被稱之為基因的序列。大概實際上是指成熟的MRNA,發生加工以後的MRNA當中的序列,大概小於5%。也就是說,非編碼序列佔了絕大多數。在人體細胞核裡面,遺傳信息它是以染色體的方式進行組織的,分布於22個常染色體和2條性染色體。我們都知道以前的生物科學的特點,基本上是師傅帶徒弟、作坊式的操作。那麼到了80年代中期的時候,我想一個是生命科學的這個科學思維的大大擴展,第二個是技術的這個進步。比方說當時遺傳工程已經非常成熟了,當時DNA測序也相對成熟,然後PCR的技術在那裡開始產生了。因此使得科學家們,生命科學家們的雄心壯志,在那裡萌發了,決心要沖破原來的這種作坊式的被物理學界甚至化學界不太看得起的那種運作方式,搞一點可以稱為是大科學的東西。

當然我想科學研究的條件,思維這是一個方面。但是實際上回顧一下科學史的話,很多重大的事件它還是需求在那裡拉動的。我們有的科學家批評這樣的做法,意思是說我們要注意把基礎研究和社會重大需求結合在一起。我覺得實際上這有點失之偏頗的,就是說有各種各樣類型的研究:有的是一種自由的探索,那麼這個可以非常小心,一個人的腦瓜里都可以產生諾貝爾獎的構思。但是也有一些研究的確是希望能夠造福人類的。但是這樣的研究提出的挑戰,實際上又可以孕育著不知道多少人的諾貝爾獎的思想在裡面。那麼人類基因組計劃,就是這樣一個典型。

我們看第一份,可以認為是正式的標書。我們做這個課題,一般來說首先要有標書。那麼人類基因組計劃的第一個標書,可以被認為是諾貝爾獎獲得者Dulbecco 1986年發表在《科學》雜志的一篇短文。它的這個短文的題目是什麼呢?《腫瘤研究的轉折點——人類基因組研究》。事實上我們知道美國有一位雄心勃勃的年輕總統肯尼迪上台以後,當時他在科學上有兩大計劃:一個是實現人類登月,還有一個戰勝癌症。那麼人類登月隨著阿波羅計劃的比較順利地實施,1969年人類實現了登月。但是攻克腫瘤的計劃是一個失敗的。為什麼?原來科學家把問題想得太簡單了,以為腫瘤就是一兩個基因的問題。但實際上絕大多數的腫瘤,都是多基因的問題。它涉及的面是整個基因組的問題,是遺傳信息的整體上面紊亂的這樣一些問題。就是剛才講的,我們不要以為好像一個融合基因打到小鼠裡面去,就足以引起一個白血病,不是那麼簡單的。因為如果那樣的話,你一打進去就要產生白血病,事實上我們PML羅拉白血病,在受精卵裡面注射進這個融合基因以後,需要等待一年的時間才會出現白血病而且不是每一個小時都會發生白血病。所以就提示有其他的決定因素在裡面。我們現在知道有時候幾個基因一起傳染的時候,它發生白血病的速率就會大大加快。

Dulbecco這個文章它就說,如果我們想更多地了解腫瘤,我們從現在開始必須關注細胞的基因組。從哪那個物種著手努力?如果我們想理解人類腫瘤,那就應該從人類開始。人類腫瘤研究將因對DNA的詳細知識而得到巨大的推動。實際上絕大多數的人類疾病都是多基因的。人類基因組計劃正式起動,現在一般的說法是1990年。那麼1990年因為是美國國會通過了正式啟動這樣一個計劃。這個計劃雄心勃勃就是要用15年的時間,到2005年完成DNA的全序列的測定。這個投資量是多少呢?30億美元。當時計算的依據是測一個鹼基對大概需要一美元。整個計劃在這個地方實際上是一個比較狹義的一個計劃,這個計劃實際上就是一個測序計劃。實際上我們講測序,讀出天書只是理解人類自身的第一步,最重要的是讀懂天書。但是即使是這樣讀出天書一個計劃的話,它也要經歷很多的磨難,很多的困難。也就是說,到今天為止,我們還沒有這樣的技術說,拿來一條染色體,我們就能夠直接測序,從一頭測到另外一頭我們沒有辦法這樣做。所以整個人類基因組計劃,實際上可以簡單地說就是由復雜到簡單再由簡單又回歸復雜,最後大概還是回歸到簡單。也就是說把不能直接測序的一條染色體拿來給它進行分解,分解成比較小的可以操作的這樣的單位。那麼怎麼分解呢?那就是作圖,你可以用遺傳學的方法去作圖,也可以用物理學的方法來作圖。我們知道遺傳學作圖,就是利用遺傳學的標志來確定DNA標志間相對的距離。另外一個概念就是說要構成一些所謂的DNA連續的克隆系,那麼這些片斷,它互相之間重疊,它可以覆蓋整個的染色體,從一端覆蓋到另外一端。這樣就把一個不能直接拿來測序的單位,就給它解析成比較小的、可以操作的這樣一個單位。最後給它重新組合成忠實於原來染色體裡面生命信息這個排列的,這樣一個狀況在這裡面,識別全部的人類基因。所以人類基因組就是作圖,或者狹義的人類基因組計劃,就是作圖的計劃,遺傳圖、物理圖、序列圖,然後基因圖。

在人類基因組計劃進行大規模測序的策略有兩種,一種就是我剛才說的那種思路,實際上叫逐個克隆。我剛才說了,你把DNA克隆的連續克隆系建起來了,覆蓋整條染色體了,然後你就把一個一個的克隆,用得最多的就是叫BAC--細菌的人工染色體,大概100多個KB這樣的長度。那麼把這個克隆一個一個挑出來,挑出來以後再進行亞克隆。這種亞克隆就是這樣的,就可以測序了,測序以後再給它組裝起來、還原起來。這樣一個策略,是國際上公共領域的測序計劃所採取的策略。實際上它是歷史的沿革,就是說從作圖,遺傳、物理作圖演化過來的。我們都知道美國的瑟拉爾公司,也知道奎克曼特。那麼它搞了一個叫全基因組鳥槍法,在一定作圖信息基礎上,繞過大片段連續克隆系統的構建而直接將基因組分解成小片段隨機測序,然後利用超級計算機來進行組裝。能夠使得人類基因組,在初步完成作圖以後,很快地邁入到測序,尤其是大規模測序。並且使得整個進度朝向人們的預期。這裡面有兩個重大因素的貢獻,不得不承認這裡面,工業界的貢獻是非常大的。比如說在人類基因組起步的時候,當時用的這個DNA序列的分析方法,還是凝膠電泳儀為主的方法,基本上還是手工運作的。但是在20世紀90年代上半段的時間裡面,新的一個測序技術出現了,毛細管電泳儀。另外把自動化的運作和包括工業界的管理這種系統,都引進來。所以使得測序的速度大大加快。你像這樣一個測試儀,它的名字就叫做Megabace。什麼意思?就是毛細管電泳,它差不多兩小時就可以進行讀出一個序列,大概能夠讀到幾百個鹼基,那麼它一天可以做十班,那麼它是96道,所以一天可以做960道。每一道按照他們的宣傳,都可以達到一個KB的話,實際上是很難做到的,這是最理想的狀態下。所以一天就可以有100萬個鹼基對的產出。但是曾經使學術界感覺比較困惑的另外一個問題,就是說如果我們現在處於一個知識爆炸的這樣一個時代,可以說生物信息的爆炸,是最最給人印象深刻的。

我們看在基因組計劃起步之前,在公共資料庫里邊DNA序列增長非常緩慢。然後1990年以後,就是指數增長期。而且這個東西我是統計到去年、2000年兩家世界的公共領域,測序計劃和瑟拉爾分別宣布完成了所謂的工作草圖。這個時候是這樣一個情況,現在大概是這樣的情況。1999年當時面對著瑟拉爾的強行挑戰,它是1998年成立的,號稱三年要拿下人類基因組,國際人類基因組計劃決定迎接挑戰。就由國際上16個組,分擔了人類基因組測序的任務,中國也加入這樣一個測序計劃。當然我們承擔的是1%的任務,1%還是很重要的。因為對於一個發展中的國家來說,能夠擠入到這種屬於發達國家的俱樂部裡面,應該說還是很不容易的。有些事情我們想擠也不一定擠得進去的,像空間站的計劃,人家還防範你。

在這里我想介紹一下什麼叫工作框架圖?因為都在說工作框架圖,什麼叫工作框架圖?其實就是一個工作草圖。那麼它的意思呢?就是說通過對染色體位置明確的BAC(細菌人工染色體)連續克隆系4—5倍覆蓋率的測序,獲得基因組90%以上的基因序列,其錯誤率應該低於1%。也就是說你的覆蓋面要達到基因組的90%以上。第二個呢,錯誤率應該低於1%。100個鹼基對立面允許你有一個以下的鹼基對的錯誤。雖然這只是一張草圖,但是它已經有用途,就是對基因組結構的基本認識,基因的識別和解析、疾病基因的定位克隆、單個核苷酸的多態性的發現等。

那麼講到草圖就一定有一個最終完成圖了,所以這張圖的定義,要求測序所用的克隆能忠實地代表常染色質的基因組結構,覆蓋率要達到99.9%以上,然後序列的錯誤率應該低於萬分之一。與工作框架圖的關系呢,實際上就是在工作框架圖的基礎上再加大測序的覆蓋率,填補空隙,使得序列的精度增加,能夠達到這樣一個標准。也就是說,它是草圖的下一步。2000年6月25號,當時的測序的情況是怎麼樣的呢?我們看當時在公共領域就是說各國政府支持的六各國家,美國、英國、德國、日本、法國、中國,六國政府支持的公共領域的計劃,當時是覆蓋了大概人類基因組的86.8%。其中包含一部分已經完成,就是我們剛才說的最終序列圖這樣標準的序列大概是20%多一點點,然後66%左右的序列處於所謂的工作草圖這樣的階段。那麼也可以說,還沒有完成。因為我們說要達到90%以上,但是同時瑟拉爾他號稱他的覆蓋率已經超過了95%。當然他的覆蓋率其實包括了所有的公共領域的這個貢獻,再加上他的貢獻,所以兩者相加起來。我想我們應該相信大概90%以上的序列,都是被工作草圖以上的這樣一個序列的質量所覆蓋著。我們看看公共領域測序計劃當時的情況,在24條染色體上分布的情況。我們知道,實際上1999年12月份,22號染色體作為人類最小的染色體之一,它的全序列被測定,或者說是它的常染色體,指部分的全序列。我們注意到它的短臂這個地方,就是易染色體區域,實際上非常難測。因為都是大量的空序列,又沒有多少基因。2000年4月份21號染色體全序列完成了,也是同樣的定義,就是說常染色體的這個部分。我們看這里是用深紅的顏色來表示,差不多就是最終完成的。而這種黃顏色表示的是我們剛才說的工作草圖,在大部分染色體區域,是工作草圖部分。實際上現在我們講的,完成人類基因組全序列的測定,都是指的常染色體部分,所以有的人說也許人類基因組序列永遠也不能被結束。

2001年2月15日,我們知道公共領域在《自然》上,都是有一種分庭抗禮的,兵對兵、將對將的感覺。2月16號就登了瑟拉爾序列,顯然,經過新的一輪角逐,比2000年6月份的時候,完成序列的質量又要高得很多。所以這樣的話,應該認為,兩家加在一起的信息,應該說比我剛才說的一般的定義又要進一步了。所以就產生了一個在工作草圖和最終完成圖之間的一個中間狀態,這個中間狀態就叫做高質量的草圖。但是就是這樣一個高質量的草圖,讓我們已經基本上知道我人體生命信息的家當到底有多大。弄到最後我們發現我們的家當好像還是比較可憐的,比我們原來的想像,因為我們的基因數量大概只有線蟲,只有900多個細胞的一個生命體的大概一倍左右,我們就比那麼一個小蟲多一倍。從低等生物到高等生物它的基因組的復雜度,與其說是由基因的數量來決定的,還不如說更主要的是由基因的長度來決定的。我們最近完成了一個細菌的測序,叫鉤端螺旋體,可以引起傳染病的。它平均一個KB就有一個基因,這么小的一個東西,500萬個鹼基對的一個基因組,有5000個基因。我們人30億個鹼基對,我們不過就3萬個,頂多接近4萬個這樣一個數字。但是你看到了酵母,到了真核細胞的話,那它就是平均大概5到10個KB一個基因。然後到了果蠅的話,雖然它的基因數量好像還沒有線蟲的多。但是它的基因長度已經達到10個KB以上,然後到了哺乳類一個基因,大概像人類現在是100多個KB才有一個基因。所以替換、剪接這種可能性就大大增加了。另外跟時間和空間,也就是發育階段和組織特異性表達的調控相關這些序列復雜大大增加了。雖然基因在高等生物可以達到十的五次方數量級,幾萬到十萬個這樣的比較高等的生物。但是實際上它的蛋白質的結構域,實際上如果把基因組比成一個大廈的話,組成這個大廈的預製件,這個數量實際上是比較有限的。那麼另外有一些高級生物中有更為豐富的結構域組合,神經功能、組織特異發育、調控、止血和免疫系統的基因,在脊椎動物大量擴展。數以百計的人類基因源於脊椎動物進化過程中某個時間點上,細菌基因的橫向轉移。基因組在不同個體之間差異很大——單核苷酸多態性,單倍體的基因差異為1/1250,能夠導致蛋白質變異的不到1%。

這本遺傳天書,已經放在我們面前了,接下來就是要讀懂它。要讀懂它,一定要從大的系統的概念來考慮怎麼樣讀懂。一個這個基因組的信息,和外界的環境,是在那裡相互作用。另外這個基因組的信息不是從天上掉下來的,它是通過一個漫長的幾十億年進化的過程發展過來的,所以要用比較的方法去讀它。另外要考慮到在個體之間和群體之間又是有變異的,這種變異也受到外界環境的一些調節。所以功能基因組學的研究內容,雖然現在沒有一個嚴格的定義,但是我個人認為,至少包括這幾個方面:人類基因組DNA序列變異性研究,其核心的內容是SNP,因為這是最常見的變異類型,當然還有很多其他的變異。然後基因組表達調控的研究,這個是發育階段組織器官的變異,然後模式生物體的研究,這個裡麵包括進化的意思,和利用模式生物進行功能研究。當然從事所有這些研究,就像我們進行測序研究一樣。生物信息學,它既是一個基本的工具,又是一個新興的學科。因為最後要把這些信息整合起來,搞成一個我們所說的,系統生物學的話,你一定要用理論的手段,和大規模信息處理的手段。

那麼基因組DNA序列變異性的研究,SNP,這種變異類型實際上是所有基因組的共同特徵。它在相當大的程度上決定了不同的個體群體,這個是指的人類在疾病的易感性,對環境致病因子反應性和其他性狀上面的差別。

在這里我舉一個例子,說明這個性狀有多麼重要。我們就來看一看,我們對葯物的反應性。我想我們每一個人、再健康的人,一生當中總要接觸一些葯物的。現在有一個新的提法叫葯物遺傳學,指的是大部分葯物,在體內代謝的酶會有遺傳多態性。像這里,一類是改變基團的一些酶,一類是對基團進行轉移的一些酶。它都有很多的多態性,這種多態性的後果是什麼呢?它在相當大的程度上決定了我們個體對葯物的反應性。比方說這是一個很復雜的程序,但是我想我們主要的信息在這個地方。對於某一個葯物來說,最適合它的基因型的,它的療效可以達到75%,毒性只有1%。同樣一個葯,如果到了一個最不適合它的一個個體的情況是怎麼樣?它的療效只有10%,毒性大於80%。那麼基因組表達以及表達的調控的這個研究,這個我想都可以理解。那麼指的是在全細胞的水平,如果是在單細胞的生命體是整個生命體的水平,識別基因組的所有轉錄表達的產物。實際上它是高通量的結構生物學,大批量解析蛋白質的高級結構,是連接基因組功能研究和新葯開發研究的橋梁。然後為了在這樣大的規模上,在整體水平上獲得功能信息,需要一些所謂的並行化的分析手段。就是現在已經做得到在指甲蓋大小的生物晶元上點上人類的基因組,所有的基因都點在上面。所以有人說將來要去看病不光要帶病卡,還要帶一個自己的晶元。醫生用葯診斷之前先把晶元插進去,看看你可能得什麼病,說起來很好,也很嚇人的。模式生物體的研究一般的說法大概從單細胞、第一個生命跟外界隔絕以後,到現在的萬物之靈的人類,大概是14億年的進化史。那麼通過進化不同階段的生物體基因組序列的比較,發現基因組結構組成和功能調節的規律。

那麼基因組計劃,我剛才說一個是科學興趣使然,科學家要探索人類的自身,另外也是社會驅動使然,就是說要戰勝人類的疾病。所以最後它的價值的實現,我想還是應該回歸到對人類的健康的貢獻上面去。那麼在這個意義上說,人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的信息。我們看到過去的十年當中,由於人類基因組研究的帶動,使得人類疾病相關性的研究有了長足的進步。單基因疾病由於定位克隆和定位候選克隆的新思路,導致了一大批遺傳病基因的發現。我們知道傳統的對基因的認識,是從表型到基因型。也就是你知道一個蛋白質,你測定了它的氨基酸的序列,然後根據密碼址的原理,你推測它的DNA的序列可能是什麼。你合成一個探針到基因組當中一調,把基因調出來。比方說血紅蛋白病,這是第一個人類發現的分子病,它就是先知道了豬蛋白氨基酸的序列,然後再把它的基因調出來。但是絕大多數的人類疾病,我們不知道它的生化基礎是什麼東西,特別是在基因組計劃之前。比方說像亨氏舞蹈病,我們就知道這個人會手舞足蹈,叫亨氏舞蹈病。比方說像遺傳性的結腸癌,我們知道大腸部位大容易長息肉,但是我們不知道那個蛋白質出了問題。你怎麼辦?怎麼來找到它的疾病基因?所以有了一個新的概念,叫反過來的遺傳學,是什麼呢?先去找它的基因,然後再去看它的表型。一旦拿到基因以後,很容易你馬上可以推測它的蛋白質的結構。你可以產生抗體,你可以接下來做很多基因的功能。健康相關的研究是HGP的重要組成部分,1997年相繼提出:腫瘤基因組的解剖計劃,環境基因組計劃。

人類基因組計劃對醫學的貢獻。基因診斷,基因治療和基因組信息為基礎的治療,發展中國家和發達國家越來越重視疾病的預防,特別是基於基因組信息的疾病預防。我國一貫提倡的是預防為主。如果能夠在一個人剛出生的時候進行疾病易感基因的識別,在早期把風險人群挑出來,然後在環境因子、生活方式上實施干預。生物技術發生了深刻的變化,更多地進入到細胞、胚胎和組織的研究水平上來,推動了胚胎和成年期幹細胞技術的應用。血液病研究與其他先進學%

Ⅲ HGP(Human Genome Project)的主要內容是什麼

HGP的主要任務是人類的DNA測序,遺傳圖譜、物理圖譜、序列圖譜 、基因圖譜,此外還有測序技術、人類基因組序列變異、功能基因組技術、比較基因組學、社會、法律、倫理研究、生物信息學和計算生物學、教育培訓等目的。

1986年,諾貝爾獎得主杜爾貝科(R. Dulbecco)在《科學》(Science)周刊撰文回顧腫瘤研究的進展,指出要麼依舊採用「零敲碎打」的策略,要麼從整體上研究和分析人類基因組。

研究歷史:

對人類基因組的研究在70年代已具有一定的雛形,在80年代在許多國家已形成一定規模。1984年在Utah州的Alta,White R and Mendelsonhn M受美國能源部(DOE)的委託主持召開了一個小型專業會議討論測定人類整個基因組的DNA序列的意義和前景。

1985年5月在加州Santa Cruz由美國DOE的Sinsheimer RL主持的會議上提出了測定人類基因組全序列的動議,形成了美國能源部的「人類基因組計劃」草案。

Ⅳ 人類基因組計劃的研究進展

完成人類基因組序列完成圖
⑴ 從當前物理圖譜生成的克隆產生完成的序列,覆蓋基因組的常染色質區域大於96%。大約1Gb的完成序列已經實現。剩下的也已經形成草圖,所有的克隆期望達到8~10倍的覆蓋率,大約2001年中期(99.99%的正確率),使用已經建立的和日益自動化的協議。
⑵ 檢測另外的庫來關閉gaps。使用FISH技術或其他方法來分析沒有閉合的Gaps大小。22,21條染色體用這種方式。2003年已經完成。
⑶ 開發新的技術來關閉難度較大的gaps,大約幾百個。
基因組序列工作框架圖(Working draft):通過對染色體位置明確的BAC連續克隆系4-5倍覆蓋率的測序(在BAC克隆水平的覆蓋率不應低於3倍),獲得基因組90%以上的序列,其錯誤率應低於1%。工作框架圖可用於基因組結構的認識、基因的識別和解析、疾病基因的定位克隆,SNP的發現等。
草圖的作用
1、草圖,許多疾病相關的基因被識別
2、SNP(人與人之間的區別),草圖提供了一個理解遺傳基礎和人類特徵進化的框架。
3、草圖後,研究人員有了新的工具來研究調節區和基因網路。
4、比較其它基因組可以揭示共同的調控元件,和其他物種共享的基因的環境也許提供在個體水平之上的關於功能和調節的信息。
5、草圖同樣是研究基因組三維壓縮到細胞核中的一個起點。這樣的壓縮可能影響到基因調控
6、在應用上,草圖信息可以開發新的技術,如DNA晶元、蛋白質晶元,作為傳統方法的補充,目前,這樣的晶元可以包含蛋白質家族中所有的成員,從而在特定的疾病組織中可以找到那些是活躍的。
2001年2月12日,美國Celera公司與人類基因組計劃分別在《科學》和《自然》雜志上公布了人類基因組精細圖譜及其初步分析結果。其中,政府資助的人類基因組計劃採取基因圖策略,而Celera公司採取了「鳥槍策略」。至此,兩個不同的組織使用不同的方法都實現了他們共同的目標:完成對整個人類基因組的測序的工作;並且,兩者的結果驚人的相似。整個人類基因組測序工作的基本完成,為人類生命科學開辟了一個新紀元,它對生命本質、人類進化、生物遺傳、個體差異、發病機制、疾病防治、新葯開發、健康長壽等領域,以及對整個生物學都具有深遠的影響和重大意義,標志著人類生命科學一個新時代的來臨。
眾多發現
1、分析得知:全部人類基因組約有2.91Gbp,約有39000多個基因;平均的基因大小有27kbp;其中G+C含量偏低,僅佔38%,而2號染色體中G+C的含量最多;到目前仍有9%的鹼基對序列未被確定,19號染色體是含基因最豐富的染色體,而13號染色體含基因量最少等等(具體信息可參見cmbi 特別報道:生命科學的重大進展)。
2、目前已經發現和定位了26000多個功能基因,其中尚有42%的基因尚不知道功能,在已知基因中酶佔10.28%,核酸酶佔7.5%,信號傳導佔12.2%,轉錄因子佔6.0%,信號分子佔1.2%,受體分子佔5.3%,選擇性調節分子佔3.2%,等。發現並了解這些功能基因的作用對於基因功能和新葯的篩選都具有重要的意義。
3、基因數量少得驚人:一些研究人員曾經預測人類約有14萬個基因,但Celera公司將人類基因總數定在2.6383萬到3.9114萬個之間,不超過40,000,只是線蟲或果蠅基因數量的兩倍,人有而鼠沒有的基因只有300個。如此少的基因數目,而能產生如此復雜的功能,說明基因組的大小和基因的數量在生命進化上可能不具有特別重大的意義,也說明人類的基因較其他生物體更'有效',人類某些基因的功能和控制蛋白質產生的能力與其他生物的不同。這將對我們目前的許多觀念產生重大的挑戰,它為後基因組時代中生物醫學的發展提供新的非凡的機遇。但由於基因剪切,EST資料庫的重復以及一些技術和方法上的誤差,將來亦可能人類的基因數會多於4萬。
4、人類單核苷酸多態性的比例約為1/1250bp,不同人群僅有140萬個核苷酸差異,人與人之間99.99%的基因密碼是相同的。並且發現,來自不同人種的人比來自同一人種的人在基因上更為相似。在整個基因組序列中,人與人之間的變異僅為萬分之一,從而說明人類不同「種屬」之間並沒有本質上的區別。
5、人類基因組中存在「熱點」和大片荒漠。在染色體上有基因成簇密集分布的區域,也有大片的區域只有「無用DNA」 ——不包含或含有極少基因的成分。基因組上大約有1/4的區域沒有基因的片段。在所有的DNA中,只有1%-1.5%DNA能編碼蛋白,在人類基因組中98%以上序列都是所謂的「無用DNA」,分布著300多萬個長片斷重復序列。這些重復的「無用」序列,決不是無用的,它一定蘊含著人類基因的新功能和奧秘,包含著人類演化和差異的信息。經典分子生物學認為一個基因只能表達一種蛋白質,而人體中存在著非常復雜繁多的蛋白質,提示一個基因可以編碼多種蛋白質,蛋白質比基因具有更為重要的意義
6、男性的基因突變率是女性的兩倍,而且大部分人類遺傳疾病是在Y染色體上進行的。所以,可能男性在人類的遺傳中起著更重要的作用。
7、人類基因組中大約有200多個基因是來自於插入人類祖先基因組的細菌基因。這種插入基因在無脊椎動物是很罕見的,說明是在人類進化晚期才插入我們基因組的。可能是在我們人類的免疫防禦系統建立起來前,寄生於機體中的細菌在共生過程中發生了與人類基因組的基因交換。
8、發現了大約一百四十萬個單核苷酸多態性,並進行了精確的定位,初步確定了30多種致病基因。隨著進一步分析,我們不僅可以確定遺傳病、腫瘤、心血管病、糖尿病等危害人類生命健康最嚴重疾病的致病基因,尋找出個體化的防治葯物和方法,同時對進一步了解人類的進化產生重大的作用。
9、人類基因組編碼的全套蛋白質(蛋白質組)比無脊椎動物編碼的蛋白質組更復雜。人類和其他脊椎動物重排了已有蛋白質的結構域,形成了新的結構。也就是說人類的進化和特徵不僅靠產生全新的蛋白質,更重要的是要靠重排和擴展已有的蛋白質,以實現蛋白質種類和功能的多樣性。有人推測一個基因平均可以編碼2-10種蛋白質,以適應人類復雜的功能。
模式生物:酵母(yeast)、大腸桿菌(Escherichia coli)、果蠅(Drosophila melanogaster)、線蟲(Caenorhabditis elegans)、小鼠(Mus musculus)、擬南芥、水稻、玉米等等其它一些模式生物的基因組計劃也都相繼完成或正在順利進行。
目前基因組學的研究出現了幾個重心的轉移:一是將已知基因的序列與功能聯系在一起的功能基因組學研究;二是從作圖為基礎的基因分離轉向以序列為基礎的基因分離;三是從研究疾病的起因轉向探索發病機理;四是從疾病診斷轉向疾病易感性研究。
在後基因組時代,如果在已完成基因組測序的物種之間進行整體的比較、分析,希望在整個基因組的規模上了解基因組和蛋白質組的功能意義,包括基因組的表達與調控、基因組的多樣化和進化規律以及基因及其產物在生物體生長、發育、分化、行為、老化和治病過程中的作用機制都必須發展新的演算法以充分利用超級計算機的超級計算能力。
美國和英國科學家2006年5月18日在英國《自然》雜志網路版上發表了人類最後一個染色體——1號染色體的基因測序。
在人體全部22對常染色體中,1號染色體包含基因數量最多,達3141個,是平均水平的兩倍,共有超過2.23億個鹼基對,破譯難度也最大。一個由150名英國和美國科學家組成的團隊歷時10年,才完成了1號染色體的測序工作。
科學家不止一次宣布人類基因組計劃完工,但推出的均不是全本,這一次殺青的「生命之書」更為精確,覆蓋了人類基因組的99.99%。解讀人體基因密碼的「生命之書」宣告完成,歷時16年的人類基因組計劃書寫完了最後一個章節。 人類基因組計劃中還包括若干個模式生物體基因組計劃,中國重點支持的水稻基因組研究計劃亦可劃入這一范疇。模式生物體一直就是生命科學領域研究的基本模型,加之它們與人類相比基因組結構簡單、單位DNA長度上基因密度高, 易於基因的識別,而且從低等至高等的各個模式生物是研究基因分子進化的絕佳材料。各模式生物體之間的比較性研究將有助於人類基因的結構與功能的闡明。對於在整體水平研究基因的功能,模式生物體更有著無法取代的地位。
中國的基因組研究工作起步較晚,而且是基礎差、底子薄、資金少,與國際上這幾年HGP的驚人速度相比,中們的差距很大,並且這種差距有進一步加大的可能。中國生命科學界應在如下幾個方面共同努力:
⒈ 盡快收集和利用中國寶貴的多民族基因組資源和遺傳病家系材料, 並阻止這些資源盲目流向國外。
⒉ 集中人力、物力和財力,建立互相配套的、集分子遺傳學、 自動化技術和信息技術為一體的中心,才能卓有成效地開展工作。
⒊ 根據中國國情和原有工作基礎,做到有所為有所不為, 走「短平快」和出奇制勝的道路,直接楔入基因組研究中最為關鍵的部分-基因識別,如走「cDNA計劃」道路,盡可能地克隆一大批新基因,在人類8萬~10 萬個基因中佔有一定的份額。同時,由於基因組DNA測序是一項勞動和技能密集性工作,如能引進技術, 培訓一支高水平的技術隊伍,完全有可能將人類基因組測序的一部分工作吸引到中國。
⒋ 充分利用國際基因資料庫中已有信息,建立生物信息技術, 推進中國基因組研究工作,並在基因組轉錄順序的認識及基因功能推測方面多做工作。
⒌ 多渠道籌措資金,在維護知識產權的前提下開展國際間合作。
歷史已將中國當代科學家推上了人類基因組計劃這一國際合作和競爭的大舞台,他們責無旁貸地要為供養自己的國家和人民負責,為21世紀中國的科學、技術和產業負責,唯有高瞻遠矚地認清當前的形勢和不辭勞苦、不計得失地拼搏,才有可能在國際人類基因組計劃中佔有一席之地,有著交換和分享數據的資本,共同品嘗人類基因組這一全人類的「聖餐」。
中國1994年啟動HGP,現已完成南北方兩個漢族人群和西南、東北地區12個少數民族共733個永生細胞系的建立,為中華民族基因保存了寶貴的資源,並在多民族基因組多樣性的研究中取得了成就,在致病基因研究中有所發現。定名為中華民族基因組結構和功能研究的HGP為「九五」國家最大的資助研究項目之一(700萬元),為中國在下世紀國際HGP科學的新一輪競爭中占據有利地位打好了基礎。

Ⅳ 人類基因組計劃的相關研究

1、生命科學工業的形成
由於基因組研究與制葯、生物技術、農業、食品、化學、化妝品、環境、能源和計算機等工業部門密切相關,更重要的是基因組的研究可以轉化為巨大的生產力,國際上一批大型制葯公司和化學工業公司大規模紛紛投巨資進軍基因組研究領域,形成了一個新的產業部門,即生命科學工業。
世界上一些大的制葯集團紛紛投資建立基因組研究所。Ciba-Geigy 和Ssandoz合資組建了Novartis 公司,並斥資2.5億美元建立研究所,開展基因組研究工作。Smith Kline 公司花1.25億美元加快測序的進度,將葯物開發項目的25%建立在基因組學之上。Glaxo-Wellcome 在基因組研究領域投入4,700萬美元,將研究人員增加了一倍。
大型化學工業公司向生命科學工業轉軌。孟山都公司早在1985年就開始轉向生命科學工業。至1997年,該公司向生物技術和基因組研究的投入已高達66億美元。1998年4月,杜邦公司宣布改組成三個實業單位,由生命科學領頭。1998年5月,該公司又宣布放棄能源公司Conaco,將其改造成一家生命科學公司。Dow化學公司用9億美元購入Eli Lilly公司40%的股票,從事穀物和食品研究,後又成立了生命科學公司。Hoechst公司則出售了它的基本化學品部門,轉項投資生物技術和制葯。
傳統的農業和食品部門也出現了向生物技術和制葯合並的趨勢。Genzyme Transgenics 公司培養出的基因工程羊能以較高的產量生產抗凝血酶Ⅲ,一群羊的酶產量相當於投資1.15億美元工廠的產量。據估計,轉基因動物生產的葯物成本是大規模細胞培養法的十分之一。一些公司還在研究生產能抗骨質疏鬆的穀物,以及大規模生產和加工基因工程食品。
能源、采礦和環境工業也已在分子水平上向基因組研究匯合。例如,用產甲烷菌Methanobacterium 作為一種新能源。用抗輻射的細菌Deinococcus radiorans清除放射性物質的污染,並在轉入tod基因後,在高輻射環境下清除多種有害化學物質的污染。
2、功能基因組學
人類基因組計劃當前的整體發展趨勢是什麼?一方面,在順利實現遺傳圖和物理圖的製作後,結構基因組學正在向完成染色體的完整核酸序列圖的目標奮進。另一方面,功能基因組學已提上議事日程。人類基因組計劃已開始進入由結構基因組學向功能基因組學過渡、轉化的過程。在功能基因組學研究中,可能的核心問題有:基因組的表達及其調控、基因組的多樣性、模式生物體基因組研究等。
⑴基因組的表達及其調控
1)基因轉錄表達譜及其調控的研究
一個細胞的基因轉錄表達水平能夠精確而特異地反映其類型、發育階段以及反應狀態,是功能基因組學的主要內容之一。為了能夠全面地評價全部基因的表達,需要建立全新的工具系統,其定量敏感性水平應達到小於1個拷貝/細胞,定性敏感性應能夠區分剪接方式,還須達到檢測單細胞的能力。近年來發展的DNA微陣列技術,如DNA晶元,已有可能達到這一目標。
研究基因轉錄表達不僅是為了獲得全基因組表達的數據,以作為數學聚類分析。關鍵問題是要解析控制整個發育過程或反應通路的基因表達網路的機制。網路概念對於生理和病理條件下的基因表達調控都是十分重要的。一方面,大多數細胞中基因的產物都是與其它基因的產物互相作用的;另一方面,在發育過程中大多數的基因產物都是在多個時間和空間表達並發揮其功能,形成基因表達的多效性。在一個意義上,每個基因的表達模式只有放到它所在的調控網路的大背景下,才會有真正的意義。進行這方面的研究,有必要建立高通量的小鼠胚胎原位雜交技術。
2)蛋白質組學研究
蛋白質組學研究是要從整體水平上研究蛋白質的水平和修飾狀態。目前正在發展標准化和自動化的二維蛋白質凝膠電泳的工作體系。首先用一個自動系統來提取人類細胞的蛋白質,繼而用色譜儀進行部分分離,將每區段中的蛋白質裂解,再用質譜儀分析,並在蛋白質資料庫中通過特徵分析來認識產生的多肽。
蛋白質組研究的另一個重要內容是建立蛋白質相互關系的目錄。生物大分子之間的相互作用構成了生命活動的基礎。組裝基因組各成分間的詳盡作圖已在T7噬菌體(55個基因)獲得成功。如何在模式生物(如酵母)和人類基因組的研究中建立自動方法,認識不同的生化通路,是值得探討的問題。
3)生物信息學的應用
目前,生物信息學已大量應用於基因的發現和預測。然而,利用生物信息學去發現基因的蛋白質產物的功能更為重要。模式生物體中越來越多的蛋白質構建編碼單位被識別,無疑為基因和蛋白質同源關系的搜尋和家族的分類提供了極其寶貴的信息。同時,生物信息學的演算法、程序也在不斷改善,使得不僅能夠從一級結構,也能從估計結構上發現同源關系。但是,利用計算機模擬所獲得的理論數據,還需要經過實驗經過的驗證和修正。
⑵基因組多樣性的研究
人類是一個具有多態性的群體。不同群體和個體在生物學性狀以及在對疾病的易感性與抗性上的差別,反映了進化過程中基因組與內、外部環境相互作用的結果。開展人類基因組多樣性的系統研究,無論對於了解人類的起源和進化,還是對於生物醫學均會產生重大的影響。
1)對人類DNA的再測序
可以預測,在完成第一個人類基因組測序後,必然會出現對各人種、群體進行再測序和精細基因分型的熱潮。這些資料與人類學、語言學的資料相結合,將有可能建立一個全人類的資料庫資源,從而更好地了解人類的歷史和自身特徵。另外,基因組多樣性的研究將成為疾病基因組學的主要內容之一,而群體遺傳學將日益成為生物醫葯研究中的主流工具。需要對各種常見多因素疾病(如高血壓、糖尿病和精神分裂症等)的相關基因及癌腫相關基因在基因組水平進行大規模的再測序,以識別其變異序列。
2)對其它生物的測序
對進化過程各個階段的生物進行系統的比較DNA測序,將揭開生命35億年的進化史。這樣的研究不僅能勾畫出一張詳盡的系統進化樹,而且將顯示進化過程中最主要的變化所發生的時間及特點,比如新基因的出現和全基因組的復制。
認識不同生物中基因序列的保守性,將能夠使我們有效地認識約束基因及其產物的功能性的因素。對序列差異性的研究則有助於認識產生大自然多樣性的基礎。在不同生物體之間建立序列變異與基因表達的時空差異之間的相關性,將有助於揭示基因的網路結構。
⑶開展對模式生物體的研究
1)比較基因組研究
在人類基因組的研究中,模式生物體的研究佔有極其重要的地位。盡管模式生物體的基因組的結構相對簡單,但是它們的核心細胞過程和生化通路在很大程度上是保守的。這項研究的意義是:1〕有助於發展和檢驗新的相關技術,如大規模測序、大規模表達譜檢驗、大規模功能篩選等;2〕通過比較和鑒定,能夠了解基因組的進化,從而加速對人類基因組結構和功能的了解;3〕模式生物體間的比較研究,為闡明基因表達機制提供了重要的線索。
目前對於基因組總體結構組成方面的知識,主要來源於模式生物體的基因組序列分析。通過對不同物種間基因調控序列的計算機分析,已發現了一定比例的保守性核心調控序列。根據這些序列建立的表達模式資料庫對破譯基因調控網路提供了必要的條件。
2)功能缺失突變的研究
識別基因功能最有效的方法,可能是觀察基因表達被阻斷後在細胞和整體所產生的表型變化。在這方面,基因剔除方法(knock-out)是一項特別有用的工具。目前。國際上已開展了對酵母、線蟲和果蠅的大規模功能基因組學研究,其中進展最快的是酵母。歐共體為此專門建立了一個稱為EUROFAN(European Functional Analysis Network)的研究網路。美國、加拿大和日本也啟動了類似的計劃。
隨著線蟲和果蠅基因組測序的完成,將來也可能開展對這兩種生物的類似性研究。一些突變株系和技術體系建立後,不僅能夠成為研究單基因功能的有效手段,而且為研究基因冗餘性和基因間的相互作用等深層次問題奠定了基礎。小鼠作為哺乳動物中的代表性模式生物,在功能基因組學的研究中展有特殊的地位。同源重組技術可以破壞小鼠的任何一個基因,這種方法的缺點是費用高。利用點突變、缺失突變和插入突變造成的隨機突變是另一中可能的途徑。對於人體細胞而言,建立反義寡核苷酸和核酶瞬間阻斷基因表達的體系可能更加合適。蛋白質水平的剔除術也許是說明基因功能最有力的手段。利用組合化學方法有望生產出化學剔除試劑,用於激活或失活各種蛋白質。
總之,模式生物體的基因組計劃為人類基因組的研究提供了大量的信息。今後,模式生物體的研究方向是將人類基因組8~10萬個編碼基因的大部分轉化為已知生化功能的多成分核心機制。而要獲得酶一種人類進化保守性核心機制的精細途徑,以及它們的紊亂導致疾病的各種途徑的知識,將只能來自對人類自身的研究。
通過功能基因組學的研究,人類最終將將能夠了解哪些進化機制已經確實發生,並考慮進化過程還能夠有哪些新的潛能。一種新的解答發育問題的方法可能是,將蛋白質功能域和調控順序進行重新的組合,建立新的基因網路和形態發生通路。也就是說,未來的生物科學不僅能夠認識生物體是如何構成和進化的,而且更為誘人的是產生構建新的生物體的可能潛力。該計劃在人類科學史上又豎起了一座新的里程碑!這是一項改變世界,影響人類生活的壯舉,隨著時間的推移,它的偉大意義將愈顯昭彰。
人類基因組計劃之塞雷拉人類基因組計劃
在國際人類基因組計劃(以下簡稱「國際計劃」)啟動八年後的1998年,美國科學家克萊格·凡特創辦了一家名為塞雷拉基因組(Celera Genomics)的小私立公司,開展自己的人類基因組計劃。與國際人類基因組計劃相比,公司希望能以更快的速度和更少的投資(3億美元,僅為國際計劃的十分之一)來完成。塞雷拉基因組的另起計劃被認為對人類基因組計劃是一件好事,因為塞雷拉基因組的競爭促使國際人類基因組計劃不得不改進其策略,進一步加速其工作進程,使得人類基因組計劃得以提前完成。
塞雷拉採用了更快速同時更具風險的技術全基因組霰彈槍測序法。霰彈槍測序法的思想是將基因組打斷為數百萬個DNA片斷,然後用一定的演算法將片斷的序列信息重新整合在一起,從而得到整個基因組序列。為了提高這一方法的效率,1980年代,測序和片斷信息整合達到了自動化。這一方法雖然已被用於序列長達6百萬個鹼基對的細菌基因組測序,但對於人類基因組中3千萬個鹼基對的序列測定,這一技術能否成功在當時還未有定論。
基因的智慧財產權之爭
塞雷拉基因組一開始宣稱只尋求對200至300個基因的專利權保護,但隨後又修改為尋求對「完全鑒定的重要結構」的總共100至300個靶基因進行知識產權保護。1999年,塞雷拉申請對6500個完整的或部分的人類基因進行初步專利保護;批評者認為這一舉動將阻礙遺傳學研究。此外,塞雷拉建立之初,同意與國際計劃分享數據,但這一協定很快就因為塞雷拉拒絕將自己的測序數據存入可以自由訪問的公共資料庫而破裂。雖然塞雷拉承諾根據1996年百慕達協定每季度發表他們的最新進展(國際計劃則為每天),但不同於國際計劃的是,他們不允許他人自由發布或無償使用他們的數據。
2000年,美國總統柯林頓宣布所有人類基因組數據不允許專利保護,且必須對所有研究者公開,塞雷拉不得不決定將數據公開。這一事件也導致塞雷拉的股票價格一路下挫,並使倚重生物技術股的納斯達克受到重挫;兩天內,生物技術板塊的市值損失了約500億美元。
後人類基因組計劃
後基因組計劃就是人類完成人類基因組計劃(結構基因組學)以後的若干領域,實際上是指完成順序後的進一步計劃,其實質內容就是生物信息學與功能基因組學。其核心問題是研究基因組多樣性,遺傳疾病產生的原因,基因表示調控的協調作用,以及蛋白質產物的功能。
人類基因組研究的目的不只是為了讀出全部的DNA序列,更重要的是讀懂每個基因的功能,每個基因與某種疾病的種種關系,真正對生命進行系統地科學解碼,從此達到從根本上了解認識生命的起源、種間、個體間的差異的原因,疾病產生的得機制以及長壽、衰老等困擾著人類的最基本的生命現象目的。

Ⅵ 人類基因組圖譜的介紹

由美國國立人類基因組研究所(nhgri)和能源部(doe)領導的ihgsc不久前宣布,人類基因組測序工作已圓滿完成,其發表在2004年10月21日nature(2004,431:931)上的分析
報告對2001年2月發表的初步分析報告進行了補充。這篇最新分析報告不但為世人展現了一張精度大於99%、誤差小於10萬分之一的精確版人類基因組圖譜,而且還進一步糾正了蛋白編碼基因的數量,僅為2萬~2.5萬個,而非原先估計的3萬~3.5萬個。新基因組圖譜 准確率達99.999%
旨在破譯人類基因組常染色質遺傳密碼的人類基因組計劃(hgp)自1990年啟動至2003年結束,歷時共13年, 該計劃由ihgsc來完成。ihgsc是由法國、德國、日本、中國、英國和美國等6個國家20個研究所的科學家組成的開放性國際協作組織,全球2800餘名科學家參加了ihgsc的工作。
2001年2月,ihgsc宣布,人類基因組草圖已經完成。以今天的眼光來看,草圖顯然存在很多重要的不足,例如,僅測出了約90%的常染色質基因組序列,而且序列之間存在147821個未檢測出的空缺等等。
在2001-2003年之間,ihgsc的不懈努力終於將此草圖轉化為今天這張既高度精確又相當完整的人類基因組圖。此外,在這段時間內,還陸續發表了關於第2、6、7、9、10、13、14、19、20、21、22號染色體和y染色體的詳細評注和分析,其餘12條染色體的資料不久也將發表。
現在的基因組序列(buiid35)共包含28.5億個核苷酸,它近乎完整,涵蓋了99%以上的常染色質基因組序列;准確率為99.999%,也就是說誤差率只有1個鹼基/10萬個鹼基對,比最初制訂的目標精確了10倍。
序列的連續性亦獲得了顯著改善,常染色質基因組序列中僅存在341個空缺。現在,平均每一段連續序列含有3850萬個鹼基對,約比2001年版草圖的81500個鹼基對長475倍。這些沒有中斷的已知序列可以在很大程度上幫助科學家尋找目標基因及其鄰近的調節目標基因活性的序列,並顯著減少他們尋找疾病相關性短而少見的序列的工作量和費用。在剩餘的341個空缺中,很多與片段的重復(segmentalplications)相關,需要採用新的方法才能將其填滿。
ihgsc所完成的測序工作不僅完整而且精確,足以進行一些對敏感性要求較高的科學分析,例如基因數目的研究,疾病相關性重復片段的研究,以及進化過程中基因「生」或「死」
的研究。該基因組序列的資料已於2003年4月被載入免費公用資料庫。「完成」並非意味著現在的人類基因組圖就是完美無缺的。雖然與2001版草圖相比,空缺已經從近15萬個減少至341個,但是人類基因組序列的這些頑固空缺已很難用現有的技術來填補。填補這些空隙需要做進一步的研究,並需要採用新的技術。
美國馬薩諸塞州麻省理工學院和哈佛大學broad研究所所長lander說:「已完成的人類基因組序列在准確率、完整性和連續性方面遠遠超過了我們的預期目標。它反映出全球數百名科學家為了一個共同目標——為21世紀的生物醫學奠定扎實的基礎——而進行大協作的奉獻精神。」
僅有2萬~2.5萬個蛋白編碼基因
ihgsc最新分析所得出的最出人意料的結果就是,人類基因組只含有2萬~2.5萬個蛋白編碼基因。
nhgri所長collins說:「僅僅在10年以前,大多數科學家還認為,人類基因組大約含有10萬個蛋白編碼基因。3年前,當我們對人類基因組序列草圖進行分析時,我們估計人類約有3萬~3.5萬個蛋白編碼基因,這在當時已經使很多人感到震驚。而剛剛結束的分析結果發現人類的蛋白編碼基因數比預計的還要少得多,這使我們對人類基因組的真實情況有了更准確的了解。全世界的科學家都可以從免費公用資料庫中獲得該高度精確的人類基因組序列,這就使他們有可能對人類遺傳學及其影響人類健康和疾病的機制進行更精確的研究。」
人類基因組分析的主要目的之一就是確定人類的全部基因。基因是編碼特定蛋白質的一段dna序列,是遺傳的基本功能單位。目前的研究結果顯示,人類基因組有19599個已經獲得確定的蛋白編碼基因,另外還有2188段可能為蛋白編碼基因的dna序列。
英國wellcometrustanger研究所rogers說:「由於2001年版人類基因組草圖不夠完善,因此導致了一些早期基因模型是錯誤的。基因鑒定仍是一項艱巨的任務。除了其他生物的基因組序列、更好的計算機化模型和其他手段的改進外,人類基因組測序工作的完成必將為基因鑒定工作提供極大的幫助。」
人類基因重復片段高達5.3%
科學家們認為,已完成的人類基因組序列不但確定了更為確切的人類基因數量,而且與2001版基因組序列草圖相比,質量也有顯著的提高,並且使人們對某些現象有了征(胸腺發育不良)。美國聖路易斯市華盛頓大學基因組測序中心前主任、西雅圖市華盛頓大學基因組系主任waterston說:「以前只有基因組序列草圖的時候,要對重復片段進行研究幾乎是不可能的。通過全世界科學家堅持不懈的努力,現在我們已經可以對人類基因組中這一重要而快速進化的部分進行研究了。」
重復片段覆蓋了5.3%的人類基因組,顯著多於大鼠的基因組(約為3%)或小鼠的基因組(在1%~2%之間)。重復片段為人們開啟了一個了解人類基因組是如何進化的以及人類基因組目前正在經歷什麼樣的變化的窗口。人類基因組如此高的重復片段百分比表明,在最近4000萬年內,人類的遺傳物質經歷了快速的功能變革和結構改變。這大概就是人類具有獨特的特徵,從而有別於其非人類靈長類動物祖先的原因。
ihgsc在分析中發現,重復片段在不同的人類染色體之間的分布差異很大。y染色體就是一個最極端的例子,其重復片段占總長度的25%以上。有些重復片段往往群集於每
條染色體的中部(著絲粒)或末端(端粒)附近。科學家們推測,基因組可能將著絲粒和端粒處的重復片段用作一個進化實驗室,來生成具有新功能的基因。揭示基因的「生」與「死」
已完成的人類基因組序列准確度很高,這使科學家有可能了解在人類進化過程中基因的「生」和「死」。科學家在人類基因組中發現了1000多個新基因,這些基因是大約7500萬年前人類與嚙齒類動物向不同方向進化以後產生的。這些基因多數是最近通過基因重復產生的,與免疫、嗅覺和生殖功能有關,例如,人類基因組中最近重復的兩個基因家族分別編碼兩組蛋白質,妊娠特異性β1糖蛋白和絨毛膜促性腺激素β蛋白,這兩組蛋白質可能與人類獨特的較長的妊娠期相關。
此外,科學家們還利用已完成的人類基因組序列發現並鑒定了33個幾乎沒什麼變化的基因,但是由於它們在近期發生了1個或1個以上突變而導致了其功能喪失(或稱為「死亡」)。科學家通過將這些基因與大鼠和小鼠基因組中的對應基因(鼠類中這些對應基因的功能仍保持)進行對照比較後,確定了這些無功能基因(又稱為假基因)在人類基因組的確切位置。有趣的是,科學家們還發現,上述33個假基因中的10個似乎與編碼嗅覺感受器的蛋白相關,這就有助於解釋為什麼人類的功能性嗅覺感受器較少,從而導致了人類的嗅覺比嚙齒類動物差。axel和buck不久前就因在嗅覺分子生物學方面所做出的傑出貢獻而獲得了2004年諾貝爾生理學或醫學獎。
然後,科學家將這33個假基因和黑猩猩的基因組序列草圖進行了對照比較,以確定這些基因在大約500萬年前類人猿進化為人類前是否還是有功能的。分析結果顯示,33個假基因中的27個在人類中和在黑猩猩中均無功能,但有5個假基因雖在人類中無功能,但在黑猩猩中還是有功能的。美國休斯頓baylor醫學院人類基因組測序中心主任gibbs說:「對這些人類基因組中的假基因以及黑猩猩基因組中仍有功能的對應基因的確定,為將來的研究項目打下了堅實的基礎。」gibbs等目前正在進行另一種非人類靈長類動物——恆河猴基因組的測序工作。

Ⅶ 人類的全部基因組是如何測試出來的

我們身體每一個細胞中都有一組長達32億組鹼基對的遺傳指令。

要解讀這些指令是一項無比艱巨的任務,但對我們了解自身有著深遠的意義。

人類基因組計劃這種及時分享數據的做法並不常見。科學家們更傾向於在他們可以分析並且發布結果的時候再公布研究數據。

然而,人類基因組計劃的這種做法 加速了研究過程,並且促成了研究領域一項 空前的國際合作。自此,在公共和私人領域的 研究得到深入開發,使很多與基因相關的疾病 得以被檢測出來,同時測序方法也被不斷完善。

如今,一個人的全部基因測序 只需要幾天就能完成。

但是,能夠解讀基因只是第一步而已。要了解大多數基因的功能以及它們是如何被控制的,我們還有很漫長的路要走。

這些工作將要交給我們下一代充滿進取心的研究者來完成了。

歡迎關注微信公眾號infoVision,更多精彩科普小動畫等著你!

Ⅷ 簡述人類基因組計劃的主要內容和意義

主要內容:

HGP的主要任務是人類的DNA測序,遺傳圖譜、物理圖譜、序列圖譜 、基因圖譜,此外還有測序技術、人類基因組序列變異、功能基因組技術、比較基因組學、社會、法律、倫理研究、生物信息學和計算生物學、教育培訓等目的。

意義:

1、HGP對人類疾病基因研究的貢獻

人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的信息。對於單基

2、HGP對醫學的貢獻

基因診斷、基因治療和基於基因組知識的治療、基於基因組信息的疾病預防、疾病易感基因的識別、風險人群生活方式、環境因子的干預。

因病,採用「定位克隆」和「定位候選克隆」的全新思路,導致了亨廷頓舞蹈病、遺傳性結腸癌和乳腺癌等一大批單基因遺傳病致病基因的發現,為這些疾病的基因診斷和基因治療奠定了基礎。

(8)人類基因組分析方法擴展閱讀:

人類基因組計劃 - 成果

1860至1870年:奧地利學者孟德爾根據豌豆雜交實驗提出遺傳因子概念,並總結出孟德爾遺傳定律。

1909年 :丹麥植物學家和遺傳學家約翰遜首次提出「基因」這一名詞,用以表達孟德爾的遺傳因子概念。

1944年 :3位美國科學家分離出細菌的DNA(脫氧核糖核酸),並發現DNA是攜帶生命遺傳物質的分子。

1953年 :美國人沃森和英國人克里克通過實驗提出了DNA分子的雙螺旋模型。

1969年 :科學家成功分離出第一個基因。

Ⅸ 人類基因組怎樣形成的

人類基因組,又譯人類基因體,是智慧人種的基因組。共組成24個染色體,分別是22個體染色體、X染色體與Y染色體,含有約30億個DNA鹼基對。鹼基對是以氫鍵相結合的兩個含氮鹼基,以A、T、C、G四種鹼基排列成鹼基序列。其中一部分的鹼基對組成了大約20000到25000個基因。

全世界的生物學與醫學界在人類基因組計劃中,調查人類基因組中的真染色質基因序列。發現人類的基因數量比原先預期的更少,其中的外顯子,也就是能夠製造蛋白質的編碼序列,只佔總長度的1.5%。

現代遺傳學家認為,基因是DNA(脫氧核糖核酸)分子上具有遺傳效應的特定核苷酸序列的總稱,是具有遺傳效應的DNA分子片段。基因位於染色體上,並在染色體上呈線性排列。基因不僅可以通過復制把遺傳信息傳遞給下一代,還可以使遺傳信息得到表達。不同人種之間頭發、膚色、眼睛、鼻子等不同,是基因差異所致。

人類只有一個基因組,大約有5萬~10萬個基因。

隨著人類基因組逐漸被破譯,一張生命之圖將被繪就,人們的生活也將發生巨大變化。基因葯物已經走進人們的生活,利用基因治療更多的疾病不再是一個奢望。因為隨著我們對人類本身的了解邁上新的台階,很多疾病的病因將被揭開,葯物就會設計得更好些,治療方案就能「對因下葯」,生活起居、飲食習慣有可能根據基因情況進行調整,人類的整體健康狀況將會提高,21世紀的醫學基礎將由此奠定。

利用基因,人們可以改良果蔬品種,提高農作物的品質,更多的轉基因植物和動物、食品將問世,人類可能在新世紀里培育出超級作物。通過控制人體的生化特性,人類將能夠恢復或修復人體細胞和器官的功能,甚至改變人類的進化過程。

人類基因組計劃人類基因組計劃(HGP)是由美國科學家於1985年率先提出,於1990年正式啟動的。美國、英國、法蘭西共和國、德意志聯邦共和國、日本和我國科學家共同參與了這一價值達30億美元的人類基因組計劃。按照這個計劃的設想,在2005年,要把人體內約10萬個基因的密碼全部解開,同時繪制出人類基因的譜圖。換句話說,就是要揭開組成人體10萬個基因的30億個鹼基對的秘密。人類基因組計劃與曼哈頓原子彈計劃和阿波羅計劃並稱為三大科學計劃。

1986年,諾貝爾獎獲得者Renato Dulbecco發表短文《腫瘤研究的轉折點:人類基因組測序》(Science, 231: 1055~1056)。文中指出:「如果我們想更多地了解腫瘤,我們從現在起必須關注細胞的基因組。……從哪個物種著手努力?如果我們想理解人類腫瘤,那就應從人類開始。……人類腫瘤研究將因對DNA的詳細知識而得到巨大推動。」

什麼是基因組·基因組就是一個物種中所有基因的整體組成。人類基因組有兩層意義:遺傳信息和遺傳物質。要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結構與功能、基因之間的相互關系。

為什麼選擇人類的基因組進行研究?因為人類是在「進化」歷程上最高級的生物,對它的研究有助於認識自身、掌握生老病死規律、疾病的診斷和治療、了解生命的起源。

測出人類基因組DNA的30億個鹼基對的序列,發現所有人類基因,找出它們在染色體上的位置,破譯人類全部遺傳信息。

在人類基因組計劃中,還包括對五種生物基因組的研究:大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種「模式生物」。

HGP的目的是解碼生命、了解生命的起源、了解生命體生長發育的規律、認識種屬之間和個體之間存在差異的起因、認識疾病產生的機制以及長壽與衰老等生命現象、為疾病的診治提供科學依據。

HGP的主要任務是人類的DNA測序,此外還有測序技術、人類基因組序列變異、功能基因組技術、比較基因組學、社會、法律、倫理研究、生物信息學和計算生物學、教育培訓等目的。

1.遺傳圖譜

遺傳圖譜又稱連鎖圖譜,它是以具有遺傳多態性(在一個遺傳位點上具有一個以上的等位基因,在群體中的出現頻率皆高於1%)的遺傳標記為「路標」,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、重組的百分率,1%的重組率稱為1cm)為圖距的基因組圖。遺傳圖譜的建立為基因識別和完成基因定位創造了條件。意義:6000多個遺傳標記已經能夠把人的基因組分成6000多個區域,使得連鎖分析法可以找到某一致病的或表現型的基因與某一標記鄰近(緊密連鎖)的證據,這樣可把這一基因定位於這一已知區域,再對基因進行分離和研究。對於疾病而言,找基因和分析基因是個關鍵。

第一代標記:經典的遺傳標記,例如ABO血型位點標記,HLA位點標記。20世紀70年中後期,限制性片段長度多態性(RFLP),位點數目大與105,用限制性內切酶特異性切割DNA鏈,由於DNA的一個「點」上的變異所造成的能切與不能切兩種狀況,可產生不同長度的片段(等位片段),可用凝膠電泳顯示多態性,從片段多態性的信息與疾病表型間的關系進行連鎖分析,找到致病基因。如Huntington症。但每次酶切2~3個片段,信息量有限。

第二代標記:1985年,小衛星中心、可變串聯重復VNTR可提供不同長度的片段,其重復單位長度為6~12個核苷酸,1989年微衛星標記系統被發現和建立,重復單位長度為2~6個核苷酸,又稱簡短串聯重復(STR)。

第三代標記:1996年MIT的Lander ES又提出了SNP(single nucleotide polymorphysm)的遺傳標記系統。對每一核苷酸突變率為10~9,雙等位型標記,在人類基因組中可達到300萬個,平均約每1250個鹼基對就會有一個。3~4個相鄰的標記構成的單倍型(haplotype)就可有8~16種。

2.物理圖譜

物理圖譜是指有關構成基因組的全部基因的排列和間距的信息,它是通過對構成基因組的DNA分子進行測定而繪制的。繪制物理圖譜的目的是把有關基因的遺傳信息及其在每條染色體上的相對位置線性而系統地排列出來。DNA物理圖譜是指DNA鏈的限制性酶切片段的排列順序,即酶切片段在DNA鏈上的定位。因限制性內切酶在DNA鏈上的切口是以特異序列為基礎的,核苷酸序列不同的DNA,經酶切後就會產生不同長度的DNA片段,由此而構成獨特的酶切圖譜。因此,DNA物理圖譜是DNA分子結構的特徵之一。DNA是很大的分子,由限制酶產生的用於測序反應的DNA片段只是其中的極小部分,這些片段在DNA鏈中所處的位置關系是應該首先解決的問題,故DNA物理圖譜是順序測定的基礎,也可理解為指導DNA測序的藍圖。廣義地說,DNA測序從物理圖譜製作開始,它是測序工作的第一步。製作DNA物理圖譜的方法有多種,這里選擇一種常用的簡便方法——標記片段的部分酶解法,來說明圖譜製作原理。

用部分酶解法測定DNA物理圖譜包括兩個基本步驟:

(1)完全降解:選擇合適的限制性內切酶將待測DNA鏈(已經標記放射性同位素)完全降解,降解產物經凝膠電泳分離後進行自顯影,獲得的圖譜即為組成該DNA鏈的酶切片段的數目和大小。

(2)部分降解:以末端標記使待測DNA的一條鏈帶上示蹤同位素,然後用上述相同酶部分降解該DNA鏈,即通過控制反應條件使DNA鏈上該酶的切口隨機斷裂,而避免所有切口斷裂的完全降解發生。部分酶解產物同樣進行電泳分離及自顯影。比較上述二步的自顯影圖譜,根據片段大小及彼此間的差異即可排出酶切片段在DNA鏈上的位置。下面是測定某組蛋白基因DNA物理圖譜的詳細說明。

完整的物理圖譜應包括人類基因組的不同載體DNA克隆片段重疊群圖,大片段限制性內切酶切點圖,DNA片段或一特異DNA序列(STS)的路標圖,以及基因組中廣泛存在的特徵型序列(如CpG序列、Alu序列,isochore)等的標記圖,人類基因組的細胞遺傳學圖(即染色體的區、帶、亞帶,或以染色體長度的百分率定標記),最終在分子水平上與序列圖的統一。

基本原理是把龐大的無從下手的DNA先「敲碎」,再拼接。以Mb、kb、bp作為圖距,以DNA探針的STS(sequence tags site)序列為路標。1998 年完成了具有52000個序列標簽位點(STS),並覆蓋人類基因組大部分區域的連續克隆系的物理圖譜。構建物理圖的一個主要內容是把含有STS對應序列的DNA的克隆片段連接成相互重疊的「片段重疊群(contig)」。用「酵母人工染色體(YAC)作為載體的載有人DNA片段的文庫已包含了構建總體覆蓋率為100%、具有高度代表性的片段重疊群」,近幾年來又發展了可靠性更高的BAC、PAC庫或cosmid庫等。

3.序列圖譜

隨著遺傳圖譜和物理圖譜的完成,測序就成為重中之重的工作。DNA序列分析技術是一個包括制備DNA片段化及鹼基分析、DNA信息翻譯的多階段的過程。通過測序得到基因組的序列圖譜。

HGP對人類的重要意義

1.HGP對人類疾病基因研究的貢獻

人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的信息。對於單基因病,採用「定位克隆」和「定位候選克隆」的全新思路,導致了亨廷頓舞蹈病、遺傳性結腸癌和乳腺癌等一大批單基因遺傳病致病基因的發現,為這些疾病的基因診斷和基因治療奠定了基礎。對於心血管疾病、腫瘤、糖尿病、神經精神類疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重點。健康相關研究是HGP的重要組成部分,1997年相繼提出:「腫瘤基因組解剖計劃」「環境基因組學計劃」。

2.HGP對醫學的貢獻

基因診斷、基因治療和基於基因組知識的治療、基於基因組信息的疾病預防、疾病易感基因的識別、風險人群生活方式、環境因子的干預。

3.HGP對生物技術的貢獻

(1)基因工程葯物:分泌蛋白(多肽激素,生長因子,趨化因子,凝血和抗凝血因子等)及其受體。

(2)診斷和研究試劑產業:基因和抗體試劑盒、診斷和研究用生物晶元、疾病和篩葯模型。

(3)對細胞、胚胎、組織工程的推動:胚胎和成年期幹細胞、克隆技術、器官再造。

4.HGP對制葯工業的貢獻

篩選葯物的靶點:與組合化學和天然化合物分離技術結合,建立高通量的受體、酶結合試驗以知識為基礎的葯物設計:基因蛋白產物的高級結構分析、預測、模擬——葯物作用「口袋」。

個體化的葯物治療:葯物基因組學。

5.HGP對社會經濟的重要影響

生物產業與信息產業是一個國家的兩大經濟支柱;發現新功能基因的社會和經濟效益;轉基因食品;轉基因葯物(如減肥葯,增高葯)。

6.HGP對生物進化研究的影響

生物的進化史,都刻寫在各基因組的「天書」上;草履蟲是人的親戚——13億年;人是由300萬~400萬年前的一種猴子進化來的;人類第一次「走出非洲」——200萬年的古猿;人類的「夏娃」來自於非洲,距今20萬年——第二次「走出非洲」。

7.HGP帶來的負面作用

侏羅紀公園不只是科幻故事;種族選擇性滅絕性生物武器;基因專利戰;基因資源的掠奪戰;基因與個人隱私。

Ⅹ 人類基因組圖譜的解析

參加繪制人類基因組圖譜的美、英、日、法、德、中6國科學家2月12日公布了更加准確、清晰、完整的人類基因組圖譜。這是在去年完成「工作框架圖」的基礎上,經過整理、分類和排列後得到的。明天,國際權威科學刊物《自然》將以60多頁的篇幅刊登題為《人類基因組的初步測定和分析》的學術論文,對圖譜繪制中的許多發現和數據進行介紹。這是人類首次全面介紹人類基因組工作框架圖的「基本信息」。據悉,《自然》雜志網站已提前發布論文。同一期雜志還將發表多篇相關論文,涉及人類基因組圖譜的繪制方法、染色體端粒圖譜、Y染色體圖譜、生殖細胞形成過程中染色體交換基因序列的方式、人體單核苷多態性數據等,公眾可以在互聯網上免費取閱有關原始數據。
基因研究起源於孟德爾遺傳規律的發現
20世紀初孟德爾遺傳規律的重新發現,激發了人類探索遺傳信息的價值及內涵的興趣。在過去的一百年中,這些探索極大地推動了生物學的發展。科學家將這些進步分為四個階段:
第一階段是遺傳的細胞基礎——染色體的發現。 第二階段是遺傳的分子基礎——DNA雙螺旋結構的提出。 第三階段是遺傳的信息基礎的提出。科學家發現了細胞讀取基因中信息的機制,藉助重組DNA技術,可以同樣讀取基因中的信息。 第四階段是測定一個基因乃至整個基因組。這一努力已取得豐碩的成果。到目前為止已經測定了599種病毒與類病毒,205種自然存在的質粒,185種細胞器,31種真細胞,7種古細菌,一種真菌,兩種動物與一種植物。 二十世紀八十年代早期,對人類基因組計劃就形成了兩個重要共識:全面認識基因組可以極大地加速生物醫學研究,可以使研究人員全面地、沒有偏差地解決問題。1990年美國能源部與國立衛生院啟動這一計劃,英國、法國、日本也建立基因組中心開展研究。九十年代後期,人類基因組計劃加速,德國和中國相繼加入這一計劃。中國是1999年9月加入這一國際協作組,負責測定人類基因組全部序列的1%,成為參與這一計劃的惟一發展中國家。 人類基因竟然與老鼠蠅蟲有許多相似之處
科研人員曾經預測人類約有14萬個基因,但新的研究卻將人類基因總數鎖定在2.6383萬到3.9114萬個之間。也就是說,人類蛋白編碼基因總數只是線蟲和果蠅基因數目的兩倍,只是基因更復雜些。人類蛋白質有61%與果蠅同源,43%與線蟲同源,46%與酵母同源。人類17號染色體上的全部基因幾乎都可以在小鼠11號染色體上找到。數百個基因可能是由細菌在脊椎動物進化的某個環節水平轉移而來的。 在人類基因組上大約1/4的區域是長長的、沒有基因的片段。基因密度在第17、第19和第22號染色體上最高,在X染色體、第4、第18號和Y染色體上相對貧瘠。另有35.3%的基因組包含重復的序列,第19號染色體57%是重復的。染色體中心粒旁與端粒附近區域存在大量的近期片斷性重復。男性減數分裂的突變率是女性的兩倍,染色體的遠端及短臂重組率較高。研究還發現,地球上人與人之間99.99%的基因密碼是相同的。來自不同人種的人比來自同一人種的人在基因上更為相似。在整個基因組序列中,人與人之間的變異僅為萬分之一。 過去10年來,科學家們已繪制出40餘種物種的基因組圖譜。人類基因組是第一個精確測定的脊椎動物的基因組,也是目前為止測定的最大基因組。比以前測定的任何一種生物的基因組都大25倍以上,是以前測定所有基因組總和的8倍。這是人類自身的基因組信息。
繪制生物醫學研究的元素周期表
基因只佔人類DNA的很小一部分,但卻代表著人類基因組的主要生物學功能。繪制人類基因組圖譜最終的目標是編譯出全部人類基因及其編碼的蛋白清單,使之成為生物醫學研究的元素周期表。基因可以分為編碼RNA的基因以及蛋白編碼基因,工作框架圖是確定人類基因組中心蛋白編碼基因。 人類基因組計劃為醫學進步帶來空前機遇,對醫學將產生不可估量的、深遠的影響,將導致疾病的分子機制的闡明,進而根據這些機制,設計出診斷與治療的方法。 人類基因組圖譜最重要的應用之一,就是將許多生物化學功能未知的疾病基因定位。人體23對染色體由約30億個鹼基對組成,包含數萬個基因。找出30億個鹼基對在DNA鏈上的准確位置,進而識別分析出各種基因及其功能,將使人類最終征服癌症、心臟病、阿爾茨海默氏症等多種頑疾。目前科學家通過克隆的方法,至少定位了30種疾病基因,利用基因組的數據,一些常見的染色體缺失綜合症的機制將得以揭示。隨著下一步對人體各種致病基因展開全面大搜索,以及對各種基因功能及基因之間相互作用了解的加深,科學家們將在分子水平上深入了解疾病的根本發病機理,將為各種疾病的診斷、防治和新葯的開發提供有力武器。了解全部人類的基因與蛋白還可為尋找合適的葯物靶點提供便利。此外,人類基因組計劃的推進,將會促進生命科學與信息科學、材料科學等相結合,帶動一批新興高技術產業的發展。
樹起探索生命奧秘的新里程碑
人類基因組工作框架圖是一個動態的產品,數據每天都在更新,終極目標是繪制完成圖。國際協作組將人類基因組計劃分為兩個階段,第一階段是在2000年6月完成的「工作框架圖」;第二階段目前正在進行,即在2001年繪制出人類基因組的完成圖。這一任務進展迅速,人類基因組大約有32億鹼基,已經有10億鹼基的序列達到了完成圖標准。盡管要繪制完成圖還有很多工作要做,但這些信息已經可以使人們對人類基因組有一個總體的認識。 人類基因組圖譜初步分析結果是人類探索生命奧秘這一偉大工程的新里程碑,為本世紀人們全面了解這些信息的奧秘奠定了基礎。中國科學院院士、我國「863」計劃生物技術領域首席科學家強伯勤教授認為,這「說明生命科學已經發展到了更深的階段,它將推動基因組測序工作、功能基因的研究和基因技術的應用,從而推動整個生物技術的發展,也將對科技發展、經濟發展以及整個社會產生深遠影響。」據預測,在未來10至20年裡,科學家還將解讀大量生物的遺傳密碼,與此同時,還要完善全部人類基因與蛋白質的清單,對調控區域進行大規模的研究與分析等,基因組研究重點將進入確定基因結構與功能等應用研究階段,生命科學因此將迎來新的大發展。

閱讀全文

與人類基因組分析方法相關的資料

熱點內容
中式棉襖製作方法圖片 瀏覽:63
五菱p1171故障碼解決方法 瀏覽:858
男士修護膏使用方法 瀏覽:546
電腦圖標修改方法 瀏覽:607
濕氣怎麼用科學的方法解釋 瀏覽:537
910除以26的簡便計算方法 瀏覽:805
吹東契奇最簡單的方法 瀏覽:704
對腎臟有好處的食用方法 瀏覽:98
電腦四線程內存設置方法 瀏覽:512
數字電路通常用哪三種方法分析 瀏覽:13
實訓課程的教學方法是什麼 瀏覽:525
苯甲醇乙醚鑒別方法 瀏覽:82
蘋果手機微信視頻聲音小解決方法 瀏覽:700
控制箱的連接方法 瀏覽:75
用什麼簡單的方法可以去痘 瀏覽:789
快速去除甲醛的小方法你知道幾個 瀏覽:803
自行車架尺寸測量方法 瀏覽:124
石磨子的製作方法視頻 瀏覽:152
行善修心的正確方法 瀏覽:403
土豆燉雞湯的正確方法和步驟 瀏覽:276