㈠ 怎樣在NCBI進行相似性搜索(最好有例子圖片)
要做相似性搜索,需要用到blast(http://blast.ncbi.nlm.nih.gov/Blast.cgi)在線比對工具。
如果有一條DNA序列,可以做blastn,blastx,tblastx比對;尋找和此DNA相似性高的DNA或蛋白質。
如果有一條蛋白質序列,可以做blastp,tblastn比對,尋找和此蛋白質相似性較高的蛋白質或DNA。
圖示blastp
㈡ 怎樣用NCBI在一個特定全測序基因組裡面查找一個特定的基因比如在楊樹基因組裡面查找AP1這個基因
如果你知道編號就更好了,現在AP1 結果又245個,我對楊樹不熟悉,需要你自己篩選。
首先進入http://www.ncbi.nlm.nih.gov/
之後再左邊有個GENE,點擊它,進入基因主頁http://www.ncbi.nlm.nih.gov/gene/
然後在Find genes by...找gene name (symbol)這一項,進入按照基因名稱檢索界面
好運。
㈢ 怎麼使用ncbi的entrez檢索工具
集成信息檢索:ENTREZ系統編輯本段回目錄檢索伺服器可以對有目標的檢索記錄,但它主要的缺陷在於一次只能從一個資料庫中檢索到記錄;想對一批資料庫進行檢索的用戶必須為每一個目標資料庫分別發出一次申請。很明顯,這些大量的公用資料庫之間存在著邏輯聯系。例如,MEDLINE中的一篇論文可能描述一個基因的序列,該基因又在GenBank中出現。其核苷酸序列所編碼的蛋白質的序列又存放在蛋白質資料庫中。這種蛋白質的三維結構可能又是已知的,結構的數據可能出現在結構資料庫中。最後,基因可能定位在某條染色體的某個區域,這類信息存放在圖譜資料庫中。
在這些生物學上的聯系的基礎上開發了一種方法;可以通過它查詢所有與某一特殊的生物學實體有關的所有信息,而不必按次序查詢分立的資料庫。這就是一個名為Entrez的分子檢索系統。它由NCBI開發和維護,Entrez在所有的主要的資料庫計算機平台上均可使用,允許對PubMed(MEDINE)的記錄,核苷酸和蛋白質的序列數據,三維結構信息,圖譜信息進行集成的訪問。全部信息只需經過一次查詢。Entrez能夠通過資料庫之間的兩種類型聯系:相近性和硬連接來提供集成的信息檢索。
相近性
相近性聯系著一個給定的資料庫之內的記錄。使用者在查看MEDLINE中某條記錄時可以要求Entrez"找出所有類似的論文",類似的,使用者在查看一個序列的同時可以要求Entrez"找出所有與這個序列類似的序列"。一個資料庫之內的相近性關系是建立在對相似性的統計計算上的:
BLAST 序列數據可以用基本局部對比搜索工具(Basic Local Alignment Search Tool,即BLAST)相互比較。這個演算法試圖找到"高度匹配的片段對"(high-scoring segment pairs,簡記為HSPs),即能夠無缺口的對齊且達到一定的分數的成對的序列。
VAST 幾套坐標數據之間的比較採用一種名為VAST的基於向量的演算法。VAST即Vector Alignment Search Tool(Madej等,1995;Gibrat等,1996)。VAST的比較有三個步驟:
1.第一,在坐標數據的基礎上,標出所有的構成蛋白質的核心部分的α螺旋和β片層。然後根據這些二級結構單位的位置計算向量。以下的步驟使用這些向量來做對比而不是整個一套坐標。
2.然後,演算法試圖最佳的匹配這些向量,尋找類型和相對方位相同的成對的結構單位,並且在這些單位之間還要有同樣的連接方式。其目標在於識別高度相似的"核心結構",這些成對結構的匹配性要比隨機的選擇蛋白質相互比較得到的高得多。
3.最後,在每個殘基位置上使用蒙特-卡洛方法對結構的排列進行優化。
使用這個方法有可能找到一些序列相似性不明顯的蛋白質之間的結構上的關系(可能在功能上也有關系)。最後的對齊結果不一定是全局的,可能在不同的蛋白質的單獨的結構域之間配對。
需要重點注意的是VAST不是確定結構相似性的最好辦法,因為還可以利用三維坐標文件中的其它信息來做更進一步的修正,如考慮側鏈的位置及側鏈之間的相互作用的熱力學特點。而把結構壓縮成一列矢量必然會導致信息的丟失。然而,考慮到這個問題的數量級-即需要做的成對比較的次數-及採用更高級的方法所需要的計算能力和時間,VAST至少為結構相似性問題提供了一個簡單和快速的答案。
㈣ 怎樣在NCBI上搜索基因序列或者是蛋白質序列
首先打開NCBI網站首頁,然後在search一欄中選擇nucleotide,在框中輸入你要的基因序列名稱,點擊search就行。然後會出來很多結果,因為很多基因是同名的,或是一個基因在不同種屬中不一樣,尋找你要的基因序列就行了。注意的是,要確定你的基因名稱是否是統一的,我以前就是找一個基因費了很多事,之後發現是自己沒有用通用的。找到基因序列,蛋白序列就很容易了,因為結果中會顯示該基因的蛋白序列。你也可以在開始search的時候選protein,找到的就是蛋白序列了。多嘗試就好了,其實很簡單,英文不錯的話,更簡單。要有耐心。
日本DNA資料庫DDBJ、歐洲分子生物學實驗室資料庫EMBL以及其它幾個知名科研機構
有Entrez、Entrez Programming Utilities、MyNCBI、PubMed、PubMed Central、EntrezGene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、ElectronicPCR等共計36種檢索方法
國家生物技術信息中心(National Center for Biotechnology Information, 簡稱NCBI) 是美國國家醫學圖書館(NLM)的一部分(該圖書館是美國國家衛生研究所的一部分).NCBI位於馬里蘭州的貝塞斯達, 建立於1988年· NCBI保管GenBank的基因測序數據和Medline的生物醫學研究論文索引· 所有的這些資料庫都可以通過Entrez搜索引擎在線訪問·
㈥ ncbi搜索系統是什麼
是一個資料庫,裡面可以查到已經被測出的所有DNA序列,cDNA,氨基酸等的序列,還可以查看這個數據出自哪些文章,近期研究進展等,總之很強大,很強大
㈦ NCBI是什麼主要是做什麼
NCBI是National Center for Biotechnology Information的縮寫,指美國國家生物技術信息中心,建立於1988年。
NCBI的初衷是為了給分子生物學家提供一個信息儲存和處理的系統。除了建有GenBank核酸序列資料庫(該資料庫的數據資源來自全球幾大DNA資料庫,其中包括日本DNA資料庫DDBJ、歐洲分子生物學實驗室資料庫EMBL以及其它幾個知名科研機構)之外,NCBI還可以提供眾多功能強大的數據檢索與分析工具。
(7)ncbi檢索的方法是什麼擴展閱讀:
NCBI提供的資源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共計36種功能,而且都可以在NCBI的主頁www.ncbi.nlm.nih.gov上找到相應鏈接,其中多半是由BLAST功能發展而來的。
已故參議員克勞德·佩珀認識到計算機化信息處理方法對於進行生物醫學研究的重要性以及贊助立法,該立法於1988年11月4日成立了國家生物技術信息中心(NCBI),作為國家醫學圖書館的一個部門(NLM) )在美國國立衛生研究院(NIH)。
㈧ 在NCBI中如何查詢基因的功能
知道了名字,在搜索框里輸入後可以看到相應的搜索結果,然後點擊進去,有個「MIM」(在線孟德爾遺傳)就可以看到它的功能。
ORF是開放閱讀框,指的是mRNA上編碼氨基酸的那段序列,從AUG開始,直到終止子,但是不包括終止子。ORF的數據在進入NCBI主頁的右下側一個叫ORFfinder的超鏈接里,點擊進去後輸入相應序列的mRNA序列,然後再點擊ORF find就可以預測處它的ORF,但是往往會有很多結果,一般來說第一個結果是真實的,其餘的都是假陽性的。
fasta格式指的就是一個大於號開頭,後面跟上這段序列的描述,然後另起一行就是數列,給你個例子你就知道了,如下,這就是人類USF1 mRNA的fasta格式
>gi|46877100|ref|NM_007122.3| Homo sapiens upstream transcription factor 1 (USF1), transcript variant 1, mRNA
AAAAAAAAAAA
這就是fasta格式,你可以以TXT的方式保存,也可以以後綴名為.fasta的方式保存,然後以文本文件打開就行了,說白了就是個文本文件呵呵。一般情況下這樣就可以了,但是如果用blast2go來做GO分類的話,就必須用.fasta來保存,否則該軟體不識別。詳細的在NCBI上都有的,自己可以去看。