导航:首页 > 研究方法 > 基因序列分析的基本方法

基因序列分析的基本方法

发布时间:2023-02-22 19:24:28

① 已知一蛋白编码基因的序列,请问可采用怎样的方法分析,推测其功能

(一)用功能获得策略鉴定基因功能,将目的基因直接导入某一细胞或个体中,使其获得新的或更高的水平表达,通过细胞或个体生物性状的变化来研究基因功能,常用的方法有转基因技术和基因敲入技术。

(二)用功能失活策略鉴定基因功能,将细胞或个体的某一个基因功能部分或全部失活后,通过观察细胞生物学行为或个体遗传性状表型的变化来鉴定基因的功能,常用的方法有基因敲除和基因沉默技术,前者可使基因功能完全失活,后者可使基因功能部分是祸。

(三)用随机突变筛选策略鉴定基因功能

② DNA序列是怎么测量出来的

大致过程也是先把 DNA 切成短序列模板,然后把这些短序列都放固定到要成像的 chip 上,每个短序列都是一个 polony,就是说在 chip 占据一个位置,在这个位置上固定的是一批通过 PCR 复制的这段序列的克隆。
然后就跟传统方法一样,配对生长,每长一个核苷酸,就成像一次,在图像上看就是无数的小点,每个小点对应一个 polony,回头通过分析就是这个 polony 对应序列的一个核酸(其实具体的技术还很不同,这么说太粗了)。这样生长下去,就能把每个 polony 的序列给测出来了。
好处当然是因为高通量,所以一下子就把一个基因组就测了(理论上)。缺点是,每个序列长度都短:长 polony 时,每一步都会因为种种问题,有些序列模板长不下去了,信号也会变弱。最后得到的序列长度相对传统方法就短一些。
短的问题是,它很难作 de novo 的测序,就是说,因为短序列之间的交叠太少,就无法从短序列合成出全部基因组(事实上,就是传统的 sanger 法,在染色体末端,因为有大量的重复序列,也是无法很好的测出的,所以人类基因组推出时,这段是没有的)。所以只能拿旧方法测出的全基因组作参考序列,把短序列对上去(alignment)。这样,也是越长,对得越准,出现不确定结果的可能越小。
类似的问题是,测序终归是要看这序列与已知序列的异同,就要面对有很多不同,短序列对很多基因变异的检测能力会下降,比如染色体的倍增这样的。
另外的问题是 coverage,就是说用这种高通路方法,生成的以亿计的 polony,看上去看多,但可能还是会错过部分基因组,而在某些部分有很多的短序列覆盖。早期的方法,好像是能覆盖 80%,也就叫全基因组测序了。

③ DNA测序方法有哪些

第1 代测序技术——荧光标记的Sanger 法
第一代就不说了。
第2 代测序技术——循环阵列合成测序法
述第2 代测序技术中, 序列都是在荧光
或者化学发光物质的协助下, 通过读取DNA 聚合酶
或DNA 连接酶将碱基连接到DNA 链上过程中释放
出的光学信号而间接确定的. 除了需要昂贵的光学
监测系统, 还要记录、存储并分析大量的光学图像.
这都使仪器的复杂性和成本增加. 依赖生物化学反
应读取碱基序列更增加了试剂、耗材的使用, 在目前
测序成本中比例相当大. 直接读取序列信息, 不使用
化学试剂, 对于进一步降低测序成本是非常可取的.
在一个正在发生突破瓶颈巨变的领域内, 很难准确
预测未来将发生什么.
第3 代测序技术——直接测序
将基因组DNA 随机切割成大约100 kb 左右的片段,
制成单链并与六寡聚核苷酸探针杂交. 然后驱动结
合了探针的基因组文库片段通过可寻址的纳米孔阵
列. 通过每个孔的离子电流均可独立测量. 追踪电流
的变化确定探针杂交在每个基因组片段上的精确位
置. 利用基因组片段上杂交探针的重叠区域将基因
组片段文库排列起来, 建立一组完整的基因组探针
图. 利用计算机算法, 获得完整的基因组序列.

④ 怎么找基因序列

根据基因的构成原理寻找基因序列,如下:

A、C、G和T分别代表组成DNA的四种核苷酸——腺嘌呤,胞嘧啶,鸟嘌呤,胸腺嘧啶。每个字母代表一种碱基,两个碱基形成一个碱基对,碱基对的配对规律是固定的,即是:A-T,C-G。典型的他们无间隔的排列在一起,例如序列AAAGTCTGAC。

任意长度大于4的一串核苷酸被称作一个序列。关于它的生物功能,则依赖于上下文的序列,一个序列可能被正读,反读;包含编码或者无编码。DNA序列也可能包含“junk DNA”。

注:带有遗传讯息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。组成简单生命最少要265到350个基因。

(4)基因序列分析的基本方法扩展阅读:

基因序列的特点:

脱氧核糖核酸是一种由核苷酸重复排列组成的长链聚合物,宽度约22到24埃(2.2到2.4纳米),每一个核苷酸单位则大约长3.3埃(0.33纳米)。在整个脱氧核糖核酸聚合物中,可能含有数百万个相连的核苷酸。

例如人类细胞中最大的1号染色体中,就有2亿2千万个碱基对。通常在生物体内,脱氧核糖核酸并非单一分子,而是形成两条互相配对并紧密结合,且如藤蔓般地缠绕成双螺旋结构的分子。

每个核苷酸分子的其中一部分会相互连结,组成长链骨架;另一部分称为碱基,可使成对的两条脱氧核糖核酸相互结合。所谓核苷酸,是指一个核苷加上一个或多个磷酸基团,核苷则是指一个碱基加上一个糖类分子。

脱氧核糖核酸骨架是由磷酸与糖类基团交互排列而成。组成脱氧核糖核酸的糖类分子为环状的2-脱氧核糖,属于五碳糖的一种。磷酸基团上的两个氧原子分别接在五碳糖的3号及5号碳原子上,形成磷酸双酯键。

这种两侧不对称的共价键位置,使每一条脱氧核糖核酸长链皆具方向性。双螺旋中的两股核苷酸互以相反方向排列,这种排列方式称为反平行。脱氧核糖核酸链上互不对称的两末端一边叫做5'端,另一边则称3'端。

⑤ 基因分析的方法

高等真核生物的基因组一般具有80 000~100 000个基因,而每一个细胞大约只表达其中的15%〔1〕。基因在不同细胞间及不同生长阶段的选择性表达决定了生命活动的多样性,如发育与分化、衰老与死亡、内环境稳定、细胞周期调控等。比较细胞间基因表达的差异为我们揭示生命活动的规律提供了依据。

由于真核细胞 mRNA 3′端一般含有 poly( a)尾,因此现有的方法基本上都是利用共同引物将不同的 mRNA反转录成 cDNA,以 cDNA为对象研究基因表达的差异。1992年 Liang等〔2〕建立了一种差异显示反转录 pCR法( differential display reverse transcription PCR, dDRT-PCR),为检测成批基因表达的差异开辟了新天地。迄今为止已出现了大量应用该技术的研究报道〔3,4〕。然而,尽管应用 dDRT-PCR方法已经取得了不少成果,而且该方法还在不断改进之中,但它仍然存在几个难以解决的问题:(1)重复率低,至少有20%的差异条带不能被准确重复〔5〕;(2)假阳性率可以高达90%〔6〕;(3)获得的差异表达序列极少包含编码信息。近年来,针对 dDRT-PCR方法的不足,又有几种新的检测差异表达基因的方法出现,现仅就这方面的进展做一简要介绍。

1.基因表达指纹( gene expression fingerprinting, gEF): gEF技术使用生物素标记的引物 bio-T13合成 cDNA第一链,用 dGTP对其进行末端加尾,再以富含 c的引物引发合成 cDNA第二链。用限制性内切酶消化双链 cDNA,以交联有抗生物素蛋白的微球捕获 cDNA3′端,以 t4DNA连接酶连接同前述内切酶相对应的适配子,并以 bio-T13及适配子中的序列作为新的引物进行特异的 pCR扩增,得到大量的特异 cDNA片段。适配子末端被32P-dATP标记后,固定于微球上的 cDNA片段经过一系列酶切,产生的酶切片段从微球表面释放出来,其中那些含有标记末端的片段经凝胶电泳后构成 mRNA指纹图谱。通过分析不同细胞间的指纹图谱就能得到差异表达的序列〔7〕。 gEF技术所需的工作量较 dDRT-PCR明显减少,由于用酶切反应替代了条件不严格的 pCR反应,其重复性也较好,假阳性率低,并且所获得的片段中包含有一定的编码信息。 gEF技术最大的缺点在于电泳技术的局限。由于它的指纹图谱要显示在同一块电泳胶上,经过几轮酶切之后常会得到1 000~2 000条电泳带,而现有的 pAGE电泳很少能分辨超过400条带,故只有15%~30%的 mRNA能够被辨认出来,因此得到的只能是高表达基因。如果希望寻找部分新基因,这是一种比较简单有效的方法;如果希望得到有关某种细胞的基因表达谱,可能比较困难;采用双向电泳技术可能会有所帮助〔8〕。

2.基因表达系统分析( serial analysis of gene expression, sAGE): sAGE法的建立基于两条理论。首先,一段来自某个转录子确定位置的核苷酸,其长度只要有9~10个 bp,就能够特异地确认该转录子。第二,对短片段标签的链接有利于在同一克隆中对多个标签测序。 sAGE也是用生物素标记的 bio-Oligo(dT)为引物合成双链 cDNA,然后以限制酶(锚定酶)进行酶切,捕获 cDNA3′端。在此处产物被分为两部分,分别与包含有 iIS型内切酶(标签酶)位点的 a、 b连接子相接。 iIS型内切酶的特点是作用位点处于识别位点之外。这样经过酶切,就有可能得到只有9~10bp的标签序列。每两个标签的钝端结合后成为 pCR的模板,以基于 a、 b连接子的引物进行 pCR反应的结果是得到了大量每条包含两个不同来源标签的序列,接下来再用锚定酶酶切、连接,就能将多个不同的标签链接在一起(大约为每条包含数十个不同来源的标签),克隆至质粒载体中后集中测序〔9,10〕。 sAGE的最终结果是通过计算机统计得到的,根据某个标签出现频率的高低来判断并计算其所属基因表达的丰度。对于在数据库中找不到对应序列的标签,还可以利用13bp的寡核苷酸探针(9bp加上锚定酶识别位点的4bp)对 cDNA文库进行筛选,以寻找新基因。 sAGE可以检测不同细胞间已知基因表达的具体差异,精确到每个细胞中大约有多少拷贝,可以建立较全面的基因表达谱,系统地分析基因表达的差异。它的缺点在于工作量非常大,有大量的测序及计算机分析任务;而且,对于寻找新基因而言,仅用长度为13bp的寡核苷酸探针筛选 cDNA文库是很不严格的,根据我们的经验,往往是假阳性结果居多。

3 . cDNA3′端限制酶切片段显示( display of 3′ end restriction fragments of cDNAs):cDNA3′端 rFD利用带有“踵”结构的锚定 oligo(dT)引物合成 cDNA第一链,以 okayama和 berg的置换法合成 cDNA第二链,然后将双链 cDNA以限制酶消化。本方法的适配子由 a1和 a2两条寡核苷酸构成,其序列与所用限制酶识别位点相符合,先将 a2的5′端磷酸化,再加入 a1退火,就会形成一个 y型结构;把 y型适配子与酶切后的 cDNA片段相连接,以适配子及锚定引物中所含序列为特异引物进行 pCR反应,则只有 cDNA3′末端的一段被扩增出来,这时的产物可用凝胶电泳表示出来构成差异表达图谱。对于每次切割6bp的限制酶来说,每种大概只能切割8%的 cDNA,因此至少需要12种以上的限制酶才能使所有 cDNA都显示出来〔11〕。 cDNA3′端 rFD与 gEF的思路比较相似,由于它利用多种限制酶进行酶切,因此不会象 gEF因凝胶电泳分辨率不够而漏掉信息。它的重复性较好,假阳性率低,尤其是对于已知基因,可以根据选择内切酶的作用位点确定该基因在凝胶电泳中的位置并判断其含量,从而避免了进一步的分析。对于精力有限的研究人员,这可能是个值得一试的方法。 cDNA3′端 rFD方法也存在一些和 dDRT-PCR相类似的缺点,它得到的片段中包含的编码信息比较少,需要多花一些时间对所得到的差异条带进一步分析。

4.分子指数的 rNA指纹( rNA fingerprinting by molecular indexing, mI):MI是一种能够较好地显示 mRNA中编码序列的方法。它利用Ⅱ s型内切酶的作用位点在识别位点之外可以形成一个4bp的突出端的特点,设计43共64种(最外侧一个核苷酸随机)适配子,使得获取编码序列片段成为可能。首先是以常规方法合成双链 cDNA,用Ⅱ类限制酶进行酶切后连接5′端磷酸化的相应适配子,再以Ⅱ s类

⑥ 基因序列比较怎么分析

基因序列比较怎么分析
测序得到基因序列后一般都需要进行序列比对,看和目的序列的差异情况,常用的软件有DNAman,还有invitrogen的vectorVI也不错。此外还可以直接在网上进行比对,推荐NCBI网站的BLAST可以直接网上进行。

不用担心,多熟悉几遍就可以操作了,很简单的,要对自己有信心,加油!

⑦ 基因组信息学的全基因组分析

基因组全序列分析的第一步工作之一就是寻找基因组序列中的可翻译部分,即开放阅读框(ORF)。现有的方法之一是利用DNA序列上的转录和调节信号作为开放阅读框的识别标记。另一种方法是寻找与已表达序列标志(EST)具有相似性的核苷酸片段。对于真核生物的基因组,为了正确区分外显子和内含子,需与已有的cDNA序列数据进行比较,才能推算出相应的氨基酸序列。
基因组序列的初步鉴定完成后,进一步的工作就是比较不同物种间基因组,基因组的比较已在原核生物、古细菌和至少一种真核生物之间进行,主要比较基因的功能和基因在染色体上的定位。对代谢途径的比较分析可导致代谢方面的新发现,也可对已知途径进行补充和修改。比较病原菌与非病原菌的基因组可发现新的病原性基因。比较在原核生物、古细菌和真核生物中都存在的蛋白质家族可发现具有高度保守序列的古蛋白。这些古蛋白很可能在进化早期阶段的简单有机体中扮演重要角色。
随着基因组序列测定技术的发展,人类将在短时间内获得大量的基因组序列数据。因此序列分析技术面临的另一个问题就是如何以更快的速度和更高的自动化程度处理大量的基因组数据。1994年出现的GeneQuiz就是一种专为大规模序列分析而编写的软件系统,并且经过改进,已发展成一套可以多种自动化水平运作的分析软件。另外欧洲生物信息学研究所(EBI)的SRS系统和美国国家生物技术信息中心(MCBI)的Entrez也是性能优良的序列分析软件。

⑧ 基因检测方法有哪些

基因是遗传的基本单元,携带有遗传信息的DNA或RNA序列,通过复制,把遗传信息传递给下一代,指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表达。基因检测是通过血液、其他体液、或细胞对DNA进行检测的技术,是取被检测者外周静脉血或其他组织细胞,扩增其基因信息后,通过特定设备对被检测者细胞中的DNA分子信息作检测,分析它所含有的基因类型和基因缺陷及其表达功能是否正常的一种方法,从而使人们能了解自己的基因信息,明确病因或预知身体患某种疾病的风险。
基因检测可以诊断疾病,也可以用于疾病风险的预测。疾病诊断是用基因检测技术检测引起遗传性疾病的突变基因。应用最广泛的基因检测是新生儿遗传性疾病的检测、遗传疾病的诊断和某些常见病的辅助诊断。
一般有三种基因检测方法:生化检测、染色体分析和DNA分析。
1.生化检测
生化检测是通过化学手段,检测血液、尿液、羊水或羊膜细胞样本,检查相关蛋白质或物质是否存在,确定是否存在基因缺陷。用于诊断某种基因缺陷,这种缺陷是因某种维持身体正常功能的蛋白质不均衡导致的,通常是检测测试蛋白质含量。还可用于诊断苯丙酮尿症等。
2.染色体分析
染色体分析直接检测染色体数目及结构的异常,而不是检查某条染色体上某个基因的突变或异常。通常用来诊断胎儿的异常。
常见的染色体异常是多一条染色体,检测用的细胞来自血液样本,若是胎儿,则通过羊膜穿刺或绒毛膜绒毛取样获得细胞。将之染色,让染色体凸显出来,然后用高倍显微镜观察是否有异常。
3.DNA分析
DNA分析主要用于识别单个基因异常引发的遗传性疾病,如亨廷顿病等。DNA分析的细胞来自血液或胎儿细胞。
基因检测可以分为以下五类:
1.基因筛检
主要是针对特定团体或全体人群进行检测。大多数通过产前或新生儿的基因检测以达到筛检的目的。
2.生殖性基因检测
在进行体外人工授精阶段可运用,筛检出胚胎是否带有基因变异,避免胎儿患有遗传性疾病。
3.诊断性检测
多数用来协助临床用药指导。
4.基因携带检测
基因携带者如果与某些特殊基因相结合,可能会导致下一代患基因疾病,通过基因携带者的检测可筛检出此种可能,作为基因携带者婚前检查、生育时的参考。
5.症状出现前的检测
检测目的是了解健康良好者是否带有某种突变基因,而此基因与特定疾病的发生有密切的联系。
临床意义
1.用于疾病的诊断
如对结核杆菌感染的诊断,以前主要依靠痰、粪便或血液培养,整个检验流程需要在两周以上,采用基因诊断的方法,不仅敏感性大大提高,而且在短时间内就能得到结果。
2.了解自身是否有家族性疾病的致病基因,预测患病风险
资料证实10%~15%的癌症与遗传有关,糖尿病、心脑血管疾病等多种疾病都与遗传因素有关。如具有癌症或多基因遗传病(如老年痴呆、高血压、糖尿病等)的人可找出致病的遗传基因,就能够有针对性地调整生活方式,预防或者延缓疾病的发生。
3.正确选择药物,避免滥用药物和药物不良反应
由于个体遗传基因上的差异,不同的人对外来物质产生的反应也会有所不同,因此部分患者使用正常剂量的药物时,可能会出现药物过敏、红肿发疹的现象。根据基因检测的结果,可制定特定的治疗方案,从而科学地指导使用药物,避免药物毒副反应。

⑨ 如何分析基因序列

1、双序列比对需要BLAST,NCBI上有,也可以在网络搜索本地版的下载下来。

2、多序列比对需要cluxtal X软件, 要把所有基因序列fasta格式放在一起,需要输入所有序列的fasta格式,然后进行多序列联配。

阅读全文

与基因序列分析的基本方法相关的资料

热点内容
电脑打不了机维修方法 浏览:148
发动机舱的鉴别方法 浏览:915
有什么催尿的方法 浏览:175
如何洗脚养肾的方法 浏览:571
胜利兆欧表使用方法 浏览:137
朱砂使用方法 浏览:954
缓解牙疼的最快方法按摩哪里 浏览:51
游完泳耳朵闷堵快速解决方法 浏览:940
厨房中鉴别白醋显酸性的三种方法 浏览:966
折纸飞机折得最远的简便方法 浏览:67
尿酸碱度检测标准方法 浏览:828
浴室热水管道安装方法 浏览:278
手机网络黑屏解决方法 浏览:209
花卉土培检测方法 浏览:277
获取检测信息的方法有哪些 浏览:120
蛋糕比容的计算方法 浏览:738
破坏动物细胞膜最常用的方法 浏览:246
社会作业研究方法 浏览:542
手机怎么拍摄长视频的方法 浏览:302
如何把数字变成字母的方法 浏览:194