导航:首页 > 解决方法 > 预测编码区域的最简单方法是

预测编码区域的最简单方法是

发布时间:2023-01-23 15:07:12

A. 视频图像帧之间的预测编码有哪些方法

预测编码数据压缩技术建立在信号数据的相关性上。

一, 它根据某一模型,利用以前的样本值对新样本进行预测,以此减少数据在时间和空间上的相关性,从而达到压缩数据的目的,但在实际预测编码时 ,一般不是建立在数据源的数学模型上,而是基于估计理论,现代统计学理论,这是因为数据源的数学模型很难建立,有时根本无法得到其数学模型,例如时变随机系统。预测编码的算法有很多,在图像编码常用的是DPCM(different Pulse Code Molation),即:差分脉冲编码调制方法。

二,预测编码的基本思想是通过对每个像素中新增信息进行提取和编码,以此来消除像素间的冗余,这里新增信息是指像素当前实际值和预测值的差。也就是说,如果已知图像一个像素离散幅度的真实值,利用其相邻像素的相关性,预测它的可能数值,再求两者的差。利用这种具有预测性质的差值,再量化、编码传输,其效果更佳,这种方法称为DPCM法。

因此,我们知道,在预测编码中,编码和传输的并不是像素采样值本身,而是这个采样值的预测值与实际值的差值。

B. 急求:基因预测的方法和步骤

方法1:最长ORF法
将每条链按6个读码框全部翻译出来,然后找出所有可能的不间断开放阅读框(ORF),只要找出序列中最长的ORF,就能相当准确地预测出基因。最长ORF法发现基因的一般过程(包括基因区域预测和基因功能预测2个层次):
步骤1:获取DNA目标序列
① 如果已有目标序列,可直接进入步骤2;
② 可以通过PubMed查找感兴趣的资料,通过GenBank或EMBL等数据库查找目标序列。
步骤2:查找ORF并将目标序列翻译成蛋白质序列
利用相应工具,如ORF Finder、Gene feature (Baylor College of Medicine)、GenLang (University of Pennsylvania)等查找ORF并将DNA序列翻译成蛋白质序列。
步骤3:在数据库中进行序列搜索
利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索。
步骤4:进行目标序列与搜索得到的相似序列的全局比对(global alignment)
虽然步骤3已进行局部比对(local alignment)分析,但全局比对有助于进一步加深对目标序列的认识。
步骤5:查找基因家族
进行多序列比对(multiple sequence alignment),获得比对区段的基因家族信息。
步骤6:查找目标序列中的特定模序
分别在Prosite、BLOCK、Motif数据库中进行profile、模块(block)、模序(motif)检索。
步骤7:预测目标序列蛋白质结构
利用PredictProtein(EMBL)、NNPREDICT(University of California)等预测目标序列的蛋白质二级结构。
步骤8:获取相关蛋白质的功能信息
为了了解目标序列的功能,收集与目标序列和结构相似蛋白质的功能信息非常必要。可利用PubMed进行搜索。

方法2:利用编码区与非编码区密码子选用频率的差异进行基因预测
编码区的碱基组成不同于非编码区,这是由于蛋白质中20种氨基酸出现的概率、每种氨基酸的密码子兼并度和同一种氨基酸的兼并密码子使用频率不同(即密码子偏好)等原因造成的。该方法是目前各种预测程序中广泛应用的一种方法,如GCG(Genetic Computer Group研制的核酸、蛋白质分析软件包)的TestCode和Baylor Medcine College的BCM Gene Finder等程序均利用了这一方法。

方法3:利用ESTs预测基因
Expressed Sequence Tags (ESTs) 代表基因序列,若DNA序列和 EST严格匹配,这段DNA序列属于基因或假基因。此法对ESTs进行聚类和拼接,聚类和拼接的目的就是将来自同一个基因或同一个转录本的具有重叠部分(over-lapping)的ESTs整合到单一的簇(cluster)中。通过聚类可产生较长的一致性序列(consensus sequence),降低数据的冗余,纠正错误数据,并最终得到基因的全长序列。
随着信息学方法在基因预测中的进一步充分应用,一批新的基因预测方法被相继提出,如人工神经网络、隐马尔可夫模型(Hidden Markov Model, HMM)、动态规划法(dynamic programming)、法则系统(ruled-based system)、线性判别分析(Linear Discriminant Analysis, LDA)、决策树(decision tree)、傅立叶分析(Fourier analysis)等。这些方法是基于编码区所具有的独特信号,如剪接的供体和受体位点、起始和终止密码子、启动子特征、转录因子结合位点等进行预测。相关的基因预测软件包括:Procrustes、GeneID、GenScan、GRAIL等。

C. DNA基因识别技术

当人类基因组研究进入一个系统测序阶段时,急需可靠自动的基因组序列注释方法和技术,以处理大量已测定的但未知功能或未经注释的DNA序列,例如,将序列分为基因、启动子、转录调控区等。基因组注释的一个首要问题是找出所有的基因。对于基因组DNA序列中的基因识别方法,人们已研究了近二十年,这是生物信息学领域里的一个重要研究内容。由于DNA测序技术的迅速发展,我们已经得到一些完整的基因组序列,有效地解决基因识别问题显得越来越迫切。基因识别中的一个关键问题是预测编码区域。所谓编码区域预测,一般是指预测DNA序列中编码蛋白质的部分,即基因的外显子部分。而基因识别的最终目标是预测完整的基因结构,正确地识别出一个基因的所有外显子及其边界。

识别DNA序列中蛋白质编码区域的方法主要有两类。一类是基于特征信号的识别。真核基因外显子(编码区域)具有一些特别的序列信号,如内部的外显子被剪切接受体位点和给体位点所界定,5’-端的外显子一定是在核心启动子(Core Promoter,例如TATA盒)的下游,而3’-端的外显子的下游包含多聚A信号和终止编码。根据这些序列特征信号确定外显子的边界,从而达到识别编码区域的目的。 然而没有一个算法在预测基因时仅仅检测这些信号,因为这些信号的强度太弱,它们缺乏统计的显着性。另一类是基于统计度量的方法,对编码区进行统计特性分析。通过统计而获得的经验说明,DNA中密码子的使用频率不是平均分布的,某些密码子会以较高的频率使用,而另一些则较少使用。这样就使得编码区的序列呈现出可察觉的统计特异性,即“密码子偏好性(codon biases)”。利用这一特性对未知序列进行统计学分析可以发现编码区的粗略位置。统计度量方法主要包括:密码子使用倾向(codon usage)、双联密码统计度量(dicodon statistic measure)、核苷酸周期性分析(即分析同一个核苷酸在3,6,9,…位置上周期性出现的规律)、基因组中等值区(isochore)的分析等。

最初基因分析方法是进行简单的核苷酸统计,而后加上剪切保守位点的检测。以后采用了人工神经网络、隐马尔柯夫模型等先进的信息处理和分析技术,并与同源序列搜索结合起来,通过与已知基因序列或者EST序列的比较,提高基因识别的准确率。基因识别方法又可以分成两大类,即从头算方法(或基于统计的方法)和基于同源序列比较的方法。从头算方法根据蛋白质编码基因的一般性质和特征进行识别,通过统计值区分外显子、内含子及基因间区域。基于同源的方法利用数据库中现有与基因有关的信息(如EST序列、蛋白质序列),通过同源比较,帮助发现新基因。对于新的DNA序列,搜索与已知蛋白质、EST相似的区域,发现编码区域。最理想的方法是综合两大类方法的优点,开发混合算法。常见的编码区分析工具通常将多种技术组合起来,给出对编码区的综合判别,如利用下文介绍的神经网络方法等。

5.5.1 最长ORFs法

对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。例如,对于序列ATTCGATCGCAA,一种可能的密码子阅读顺序为ATT、CGA、TCG、CAA,另外两种可能的密码子阅读顺序分别为A、TTC、GAT、CGC、AA和AT、TCG、ATC、GCA、A。这三种阅读顺序称为阅读框(reading frames)。一个开放阅读框(ORF, open reading frame)是一个没有终止编码的密码子序列。

可以用最长ORFs法识别原核基因。原核基因结构相对比较简单,其基因识别任务的重点是识别开放阅读框,或者说是识别长的编码区域。辨别序列是编码区域或是非编码区域的一种方法是检查终止密码子的出现频率。由于一共有64个密码子,其中3个是终止密码子,因此,如果一条核酸序列是均匀随机分布的,那么终止密码子出现的期望次数为每21(»64/3)个密码子出现一次终止密码子。每个编码区域只存在一个终止密码子,该密码子作为编码区域的结束标志。因此,如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,那么这段序列可能就是编码区域。在实现基于上述思想的算法时,扫描给定的DNA序列,在三个不同的阅读框中寻找较长的ORF;当遇到终止密码子以后,回头寻找起始密码子,以确定完整的编码区域。

大部分早期的DNA序列数据来自于线粒体或细菌基因组,最早的基因识别方法就是针对这类序列数据而发展起来的。一个简单的算法,如果它能够发现较长的ORF,并使用长度阈值(例如300bp),则该算法将检测到大多数基因,并且具有很好的特异性。当然,这种算法比较简单,不适合处理短的ORF或者交叠的ORF。

5.5.2 基于密码子出现频率的预测方法

真核基因远比原核基因复杂,一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。为了确定基因在一段序列上所处的位置,需要首先找出基因两端的功能区域,即转录启动区和终止区,然后在启动区下游位置寻找翻译起始密码子,从而确定基因起始位置。为了取出外显子,而将内含子剔除,必须识别转录剪切位点,即剪切给体位点和剪切接受体位点。

必须清楚,要想设计一个100%识别编码区域的程序几乎是不可能的。问题是如何提高一个识别算法的敏感性Sn和特异性Sp。Sn 和Sp都应该比较高,若一个算法的测试结果仅仅一个很高,而另一个很低,则该算法是不成功的。例如,假设有一个识别编码区域的算法,它将所有介于AG和GT之间的序列片段都找出来作为识别结果,那么该算法的敏感性Sn将达到100%,但其特异性Sp却近似于0%。因此,对于一个识别算法,往往用敏感性和特异性的平均值作为衡量其准确率的指数,即(Sn+Sp)/2。在一般情况下,调整程序的参数,使得Sn»Sp。

真核DNA序列中基因的识别是一个复杂的问题,一种方法是首先通过统计分析预测编码区域,挑选出候选的外显子,然后利用动态规划方法构造最优的基因结构,这个最优的基因结构被定义为一个外显子一致的链。然而,直接运用这种方法会遇到概念上和计算上的困难。每一个候选的基因由许多统计参数来刻画,但还不清楚如何将这些统计参数组合到一个打分函数中。这个问题在一定程度上可以用神经网络来解决,运用神经网络为每个候选的外显子打分,或将神经网络与动态规划相结合,从而构造最优基因结构。然而使用标准的动态规划隐含说明仅仅考虑具有加和性的打分,而许多序列分析表明用非线性的函数有时会得到更好的效果。矢量动态规划方法为利用非线性函数提供了可能。矢量动态规划构造一组基因,并确保其中包含满足自然单调条件的函数所对应的最优基因。

这里首先介绍一种根据各个密码子出现频率识别编码区域的方法。例如,亮氨酸、丙氨酸、色氨酸分别有6个、4个和1个密码子,将一个随机均匀分布的DNA序列翻译成氨基酸序列,则在氨基酸序列中上述3种氨基酸出现的比例应该为6:4:1。但是,在真实的氨基酸序列中,上述比例并不正确。这说明DNA的编码区域并非随机序列。

假设在一条DNA序列中已经找到所有的ORF,那么,可以利用密码子频率进一步区分编码ORF和非编码ORF。将每个ORF转换为相应的密码子序列,得到一个64个状态的马尔柯夫链。这里,为每个密码子分配一个状态,状态转换概率即为一个密码子跟随在其他密码子后面的概率。利用这种方法,可以计算一个ORF成为编码区域的可能性。

在识别编码区域的马尔柯夫链模型中,一个密码子出现的概率依赖于其前面一个密码子。下面考虑另一个简单的统计模型,在该模型中,假设相继的密码子是独立的,不存在前后依赖关系。令fabc代表密码子abc在编码区域出现的频率。给定一个不知道阅读框的编码序列a1,b1,c1, a2,b2,c2,…, an+1,bn+1, 对于从密码子a1b1c1开始的阅读框,其n个密码子的出现概率为

同样,在第二种和第三种阅读框中,n个密码子出现的概率分别如下

令Pi代表第i个阅读框成为编码阅读框的概率,其值按下列公式计算:

在设计算法时,在给定的核酸序列上移动一个长度为n的窗口,对窗口内的每个序列片段按上式计算Pi,并根据Pi的值识别编码的阅读框。软件包CGC中的Codon Preference程序采用的就是这种方法。

可以将密码子使用偏性作为编码区域的一种统计特性。对现有的大量序列数据进行分析,不难发现:外显子和内含子在密码子的出现上存在着明显的差异。

在一个基因中,第i个(i=1,64)密码子相对使用倾向RSCUi的定义如下:

其中Obsi是该基因中第i个密码子实际出现的次数,而Expi是对应密码子期望的出现次数。

åaai是统计的第i个密码子出现的次数,åsyni是所有与第i个密码子同义密码子出现的次数。RSCU值大于1表示相应密码子出现的次数比期望次数高,而小于1则表示出现次数相对较少。

实验说明,连续的6个核苷酸出现频率的对比是预测一个窗口是否属于编码区域或非编码区域的最好的单个指标。若编码窗口的长度至少为50 bp,则最好的编码预测准确率约为70%。假设一段DNA序列为S,从S的第i位到第j位的双联密码统计度量IF6(i,j)定义为:

其中,fk是从第k位开始的双联密码的频率,Fk是该双联密码随机出现的频率。这里假设j的取值为大于等于6。

此外,利用密码子第三位的偏性,也可以预测编码区域。这种方法的准确率取决于对已知基因的统计,统计样本数必须足够多。

利用各种统计编码度量,可以预测一段DNA序列是否是编码区域。许多编码区域识别算法都是基于这种思想的。

分析实例:

D. 预测编码的ADPCM

进一步改善量化性能或压缩数据率的方法是采用自适应量化或自适应预测,即自适应脉冲编码调制(ADPCM)。它的核心想法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
自适应量化
在一定量化级数下减少量化误差或在同样的误差条件下压缩数据,根据信号分布不均匀的特点,希望系统具有随输入信号的变化区间足以保持输入量化器的信号基本均匀的能力,这种能力叫自适应量化。
自适应量化必须有对输入信号的幅值进行估值的能力,有了估值才能确定相应的改变量。若估值在信号的输入端进行,称前馈自适应;若在量化输出端进行,称反馈自适应。信号的估值必须简单,占用时间短,才能达到实时处理的目的。
自适应预测
预测参数的最佳化依赖信源的特征,要得到最佳预测参数显然是一件繁琐的工作。而采用固定的预测参数往往又得不到较好的性能。为了能使性能较佳,又不致于有太大的工作量,可以采用自适应预测。
为了减少计算工作量,预测参数仍采用固定的,但此时有多组预测参数可供选择,这些预测参数根据常见的信源特征求得。编码时具体采用哪组预测参数需根据特征来自适应地确定。为了自适应地选择最佳参数,通常将信源数据分区间编码,编码时自动地选择一组预测参数,使该实际值与预测值的均方误差最小。随着编码区间的不同,预测参数自适应地变化,以达到准最佳预测。 帧间预测编码是利用视频图像帧间的相关性,即时间相关性,来达到图像压缩的目的,广泛用于普通电视、会议电视、视频电话、高清晰度电视的压缩编码。
在图像传输技术中,活动图像特别是电视图像是关注的主要对象。活动图像是由时间上以帧周期为间隔的连续图像帧组成的时间图像序列,它在时间上比在空间上具有更大的相关性。大多数电视图像相邻帧间细节变化是很小的,即视频图像帧间具有很强的相关性,利用帧所具有的相关性的特点进行帧间编码,可获得比帧内编码高得多的压缩比。对于静止图像或活动很慢的图像,可以少传一些帧,如隔帧传输,未传输的帧,利用接收端的帧存储器中前一帧的数据作为该帧数据,对视觉没有什么影响。因为人眼对图像中静止或活动慢的部分,要求有较高的空间分辨率,而对时间分辨率的要求可低些。这种方法叫帧重复方法,广泛应用于视频电话、视频会议系统中,其图像帧速率一般为1~15帧/秒。
采用预测编码的方法消除序列图像在时间上的相关性,即不直接传送当前帧的像素值,而是传送x和其前一帧或后一帧的对应像素x' 之间的差值,这称为帧间预测。当图像中存在着运动物体时,简单的预测不能收到好的效果,例如当前帧与前一帧的背景完全一样,只是小球平移了一个位置,如果简单地以第k-1帧像素值作为k帧的预测值,则在实线和虚线所示的圆内的预测误差都不为零。如果已经知道了小球运动的方向和速度,可以从小球在k-1帧的位置推算出它在k帧中的位置来,而背景图像(不考虑被遮挡的部分)仍以前一帧的背景代替,将这种考虑了小球位移的k-1帧图像作为k帧的预测值,就比简单的预测准确得多,从而可以达到更高的数据压缩比。这种预测方法称为具有运动补偿的帧间预测。
具有运动补偿的帧间预测编码是视频压缩的关键技术之一,它包括以下几个步骤:首先,将图像分解成相对静止的背景和若干运动的物体,各个物体可能有不同的位移,但构成每个物体的所有像素的位移相同,通过运动估值得到每个物体的位移矢量;然后,利用位移矢量计算经运动补偿后的预测值;最后对预测误差进行量化、编码、传输,同时将位移矢量和图像分解方式等信息送到接收端。
在具有运动补偿的帧间预测编码系统中,对图像静止区和不同运动区的实时完善分解和运动矢量计算是较为复杂和困难的。在实际实现时经常采用的是像素递归法和块匹配法两种简化的办法。
像素递归法的具体作法是,仍需通过某种较为简单的方法首先将图像分割成运动区和静止区。在静止区内像素的位移为零,不进行递归运算;对运动区内的像素,利用该像素左边或正上方像素的位移矢量D作为本像素的位移矢量,然后用前一帧对应位置上经位移D后的像素值作为当前帧中该像素的预测值。如果预测误差小于某一阈值,则认为该像素可预测,无需传送信息;如果预测误差大于该阈值,编码器则需传送量化后的预测误差、以及该像素的地址,收、发双方各自根据量化后的预测误差更新位移矢量。由此可见,像素递归法是对每一个像素根据预测误差递归地给出一个估计的位移矢量,因而不需要单独传送位移矢量给接收端。
块匹配法是另一种更为简单的运动估值方法。它将图像划分为许多子块,并认为子块内所有像素的位移量是相同的,这意味着将每个子块视为一个“运动物体”。对于某一时间t,图像帧中的某一子块如果在另一时间t-t1的帧中可以找到若干与其十分相似的子块,则称其中最为相似的子块为匹配块,并认为该匹配块是时间t-t1的帧中相应子块位移的结果。位移矢量由两帧中相应子块的坐标决定。
考虑到一定时间间隔内物体可能的运动速度、运动范围和匹配搜索所需的计算量,在匹配搜索时一般仅在一个有限范围内进行。假设在给定时间间隔内最大可能的水平和垂直位移为d h和d v个像素,则搜索范围SR为
其中M、N为子块的水平和垂直像素数。
在块匹配方法中需要解决两个问题:一是确定判别两个子块匹配的准则;二是寻找计算量最少的匹配搜索算法。判断两个子块相似程度的准则可以利用两个块间归一化的二维互相关函数、两子块间亮度的均方差MSE或两子块间亮度差绝对值的均值MAD等。通过对不同判别准则的比较研究表明,各种判别准则对位移矢量的估值精度影响差别不是很大。由于MAD准则的计算不含有乘法和除法运算而成为最常使用的匹配判别准则。MAD准则定义如下:
其中Xk和Xk-1分别表示图像在第k帧和第k-1帧的像素值。当MAD最小时,表示两个子块匹配。
对于匹配搜索算法,最简单和直接的方法就是全搜索方式,即将第k-1帧中的子块在整个搜索区内逐个像素移动,每移动一次计算一次判决函数。总的移动次数为 (2d h + 1)(2d v + 1)。当d h = d v = 6时,总的计算次数为169。显然,全搜索的运算量是相当大的。为了加快搜索过程,人们提出了许多不同的搜索方法,其中应用较广的有二维对数法、三步法、共轭方向法和正交搜索法。这几种方法都基于如下的假设:当偏离最小误差方向时,判决函数是单调上升的,搜索总沿着判决函数值减小的方向进行。上述几种方案所需的搜索步骤和计算点数略有差异,但基本思路是一致的。
通过上面介绍的两种运动矢量估值方法可以看出,像素递归法对每一个像素给出一个估计的位移矢量,因而对较小面积物体的运动估值较为精确。但像素递归法在估值时需要进行叠代运算,从而存在着收敛速度和稳定性问题。块匹配法对同一子块内位移量不同的像素只能给出同一个位移估值,限制了对每一像素的估值精度。但对于面积较大的运动物体而言,采用块匹配法的预测要比采用像素递归法的预测效果好。另外,从软硬件实现角度看,块匹配算法相对简单,在实际活动图像压缩编码系统中得到较为普遍的应用。 在具有运动补偿的预测编码系统中,利用了活动图像帧间信息的相关性,通过对相邻帧图像的预测误差进行编码而达到压缩数据的目的。运动补偿技术的引入,大大提高了预测精度,使传输每一帧图像的平均数据量进一步降低。在此系统中图像的传输帧率并没有变化,仍与编码前的帧率一样。然而在某些应用场合如可视电话、视频会议等,对图像传输帧率的要求可适当降低,这就为另外一种称为帧间内插的活动图像压缩编码方法提供了可能。
活动图像的帧间内插编码是在系统发送端每隔一段时间丢弃一帧或几帧图像,而在接收端再利用图像的帧间相关性将丢弃的帧通过内插恢复出来,以防止帧率下降引起闪烁和动作不连续。恢复丢弃帧的一个简单办法是利用线性内插,设x(i, j), y(i, j)分别代表两个传输帧中相同空间位置上像素的亮度,在中间第n个内插帧对应位置的亮度z(i, j) 可用如下的内插公式:
n=1,2,3,……N-1
其中N为两个传输帧之间的帧间隔数。
简单线性帧间内插的缺点在于当图像中有运动物体时,两个传输帧在物体经过的区域上不再一一对应,因而引起图像模糊。为解决这一问题可采用带有运动补偿的帧间内插。具有运动补偿的帧间内插和帧间预测都需要进行运动估值,但二者的目的和运动估值不准确所带来的影响不完全相同。
在帧间预测中引入运动补偿的目的是为了减少预测误差,从而提高编码效率。运动估值的不准确会使预测误差加大,从而使传输的数据率上升,但接收端据此位移矢量和预测误差解码不会引起图像质量下降。而在帧间内插中引入运动补偿的目的,是使恢复的内插帧中的运动物体不致因为内插而引起太大的图像质量下降。这是由于在丢弃帧内没有传送任何信息,要确定运动物体在丢弃帧中的位置必须知道该物体的运动速度。运动估值的不准确,将导致内插出来的丢弃帧图像的失真。另外,在帧间内插中的位移估值一般要对运动区的每一个像素进行,而不是对一个子块;否则,内插同样会引起运动物体边界的模糊。因此,在帧间内插中较多使用能够给出单个像素位移矢量的像素递归法。
其他还有阈值法(只传送像素亮度的帧间差值超过一定阈值的像素)、帧内插(对于活动缓慢的图像,利用前后两帧图像进行内插,得到预测图像,然后对帧差信号进行编码)、运动估计与补偿等。

E. 预测编码的基本方法是什么

预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。
脉冲编码调制(PCM,pulse code molation)是概念上最简单、理论上最完善的编码系统。它是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。
PCM的编码原理比较直观和简单,如(1)所示。它的输入是模拟信号,首先经过时间采样,然后对每一样值都进行量化,作为数字信号的输出,即PCM样本序列x(0),x(1),…,x(n)。图中的“量化,编码”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。

折叠量化
量化有多种方法。最简单的是只应用于数值,称为标量量化,另一种是对矢量(又称为向量)量化。标量量化可归纳成两类:一类称为均匀量化,另一类称为非均匀量化。理论上,标量量化也是矢量量化的一种特殊形式。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法。
折叠标量量化
均匀量化
如果采用相等的量化间隔处理采样得到的信号值,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如(2)所示。量化后的样本值Y和原始值X的差 E=Y-X 称为量化误差或量化噪声。

非均匀量化

用均匀量化方法量化输入信号时,无论对大的输入信号还是小的输入信号一律都采用相同的量化间隔。为了适应幅度大的输入信号,同时又要满足精度要求,就需要增加量化间隔,这将导致增加样本的位数。但是,有些信号(例如话音信号),大信号出现的机会并不多,增加的样本位数就没有充分利用。为了克服这个不足,就出现了非均匀量化的方法,这种方法也叫做非线性量化。

非线性量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数来表示。量化数据还原时,采用相同的规则。

在语音信号的非线性量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一种称为m律压扩(m-law companding)算法,另一种称为A律(A-law)压扩算法。

1.m 律压扩

G.711标准建议的m律压扩主要用在北美和日本等地区的数字电话通信中,按下面的式子(归一化)确定量化输入和输出的关系:

式中:x为输入信号幅度,规格化成 -1≤< /SPAN> x≤ 1;

sgn(x)为x的极性,x<0时为-1,否则为1;

m为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取100≤ m≤ 500,多取 m =255。

由于m律压扩的输入和输出关系是对数关系,所以这种编码又称为对数PCM。具体计算时,用m=255,可以把对数曲线变成8条折线以简化计算过程。

2.A律压扩

G.711标准建议的A律压扩主要用在中国大陆和欧洲等地区的数字电话通信中,按下面的式子确定量化输入和输出的关系:

0 ≤ | x| ≤ 1/A

1/A < |x| ≤ 1

式中:x为输入信号幅度,规格化成 -1 ≤< /SPAN > x ≤ 1;

sgn(x)为x的极性,x<0时为-1,否则为1;

A为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,通常取A=87.6。

A律压扩的前一部分是线性的,其余部分与m律压扩相同。A律压扩具有与m律压扩相同的基本性能(在大信号区信噪比高于m律量化器,但在小信号区不如m律量化器)和实现方面的优点,尤其是还可以用直线段很好地近似,以便于直接压扩或数字压扩,并易于与线性编码格式相互转换。具体计算时,A=87.56,为简化计算,同样把对数曲线部分变成13条折线。

对于采样频率为8 kHz,样本精度为13比特、14比特或者16比特的输入信号,使用m率压扩编码或者使用A率压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64 kbps。这个数据就是CCITT推荐的G.711标准:话音频率脉冲编码调制(Pulse Code Molation (PCM) of Voice Frequencies)。通常的听觉主观感觉认为8位压扩量化有不低于12位均匀量化A/D的信噪比及动态范围。

折叠

阅读全文

与预测编码区域的最简单方法是相关的资料

热点内容
监控电源如何安装方法 浏览:588
拉珠百叶窗帘免打孔安装方法 浏览:32
怎么正确的敷面膜方法 浏览:876
眼底积水如何治疗方法 浏览:84
掰手腕锻炼的方法 浏览:159
现在有快速便宜检测血糖的方法吗 浏览:248
解决喝水不用嘴的方法 浏览:485
五年级数学盈亏的解决方法 浏览:375
梅树苗的种植方法 浏览:992
如何调漂最快的方法视频 浏览:542
用什么方法可以看到指纹 浏览:163
oppo锁定竖屏幕在哪里设置方法 浏览:941
如何减掉大肚腩的土方法 浏览:211
鉴定有哪些方法 浏览:436
吃过期拉肚子怎么治疗最快方法 浏览:273
手部创伤出血最简便有效的方法 浏览:473
白菜食用方法 浏览:44
金边吊兰烂心的治疗方法 浏览:558
调洪演算都有哪些方法 浏览:618
桔子种子盆栽种植方法 浏览:755