導航:首頁 > 解決方法 > 預測編碼區域的最簡單方法是

預測編碼區域的最簡單方法是

發布時間:2023-01-23 15:07:12

A. 視頻圖像幀之間的預測編碼有哪些方法

預測編碼數據壓縮技術建立在信號數據的相關性上。

一, 它根據某一模型,利用以前的樣本值對新樣本進行預測,以此減少數據在時間和空間上的相關性,從而達到壓縮數據的目的,但在實際預測編碼時 ,一般不是建立在數據源的數學模型上,而是基於估計理論,現代統計學理論,這是因為數據源的數學模型很難建立,有時根本無法得到其數學模型,例如時變隨機系統。預測編碼的演算法有很多,在圖像編碼常用的是DPCM(different Pulse Code Molation),即:差分脈沖編碼調制方法。

二,預測編碼的基本思想是通過對每個像素中新增信息進行提取和編碼,以此來消除像素間的冗餘,這里新增信息是指像素當前實際值和預測值的差。也就是說,如果已知圖像一個像素離散幅度的真實值,利用其相鄰像素的相關性,預測它的可能數值,再求兩者的差。利用這種具有預測性質的差值,再量化、編碼傳輸,其效果更佳,這種方法稱為DPCM法。

因此,我們知道,在預測編碼中,編碼和傳輸的並不是像素采樣值本身,而是這個采樣值的預測值與實際值的差值。

B. 急求:基因預測的方法和步驟

方法1:最長ORF法
將每條鏈按6個讀碼框全部翻譯出來,然後找出所有可能的不間斷開放閱讀框(ORF),只要找出序列中最長的ORF,就能相當准確地預測出基因。最長ORF法發現基因的一般過程(包括基因區域預測和基因功能預測2個層次):
步驟1:獲取DNA目標序列
① 如果已有目標序列,可直接進入步驟2;
② 可以通過PubMed查找感興趣的資料,通過GenBank或EMBL等資料庫查找目標序列。
步驟2:查找ORF並將目標序列翻譯成蛋白質序列
利用相應工具,如ORF Finder、Gene feature (Baylor College of Medicine)、GenLang (University of Pennsylvania)等查找ORF並將DNA序列翻譯成蛋白質序列。
步驟3:在資料庫中進行序列搜索
利用BLAST進行ORF核苷酸序列和ORF翻譯的蛋白質序列搜索。
步驟4:進行目標序列與搜索得到的相似序列的全局比對(global alignment)
雖然步驟3已進行局部比對(local alignment)分析,但全局比對有助於進一步加深對目標序列的認識。
步驟5:查找基因家族
進行多序列比對(multiple sequence alignment),獲得比對區段的基因家族信息。
步驟6:查找目標序列中的特定模序
分別在Prosite、BLOCK、Motif資料庫中進行profile、模塊(block)、模序(motif)檢索。
步驟7:預測目標序列蛋白質結構
利用PredictProtein(EMBL)、NNPREDICT(University of California)等預測目標序列的蛋白質二級結構。
步驟8:獲取相關蛋白質的功能信息
為了了解目標序列的功能,收集與目標序列和結構相似蛋白質的功能信息非常必要。可利用PubMed進行搜索。

方法2:利用編碼區與非編碼區密碼子選用頻率的差異進行基因預測
編碼區的鹼基組成不同於非編碼區,這是由於蛋白質中20種氨基酸出現的概率、每種氨基酸的密碼子兼並度和同一種氨基酸的兼並密碼子使用頻率不同(即密碼子偏好)等原因造成的。該方法是目前各種預測程序中廣泛應用的一種方法,如GCG(Genetic Computer Group研製的核酸、蛋白質分析軟體包)的TestCode和Baylor Medcine College的BCM Gene Finder等程序均利用了這一方法。

方法3:利用ESTs預測基因
Expressed Sequence Tags (ESTs) 代表基因序列,若DNA序列和 EST嚴格匹配,這段DNA序列屬於基因或假基因。此法對ESTs進行聚類和拼接,聚類和拼接的目的就是將來自同一個基因或同一個轉錄本的具有重疊部分(over-lapping)的ESTs整合到單一的簇(cluster)中。通過聚類可產生較長的一致性序列(consensus sequence),降低數據的冗餘,糾正錯誤數據,並最終得到基因的全長序列。
隨著信息學方法在基因預測中的進一步充分應用,一批新的基因預測方法被相繼提出,如人工神經網路、隱馬爾可夫模型(Hidden Markov Model, HMM)、動態規劃法(dynamic programming)、法則系統(ruled-based system)、線性判別分析(Linear Discriminant Analysis, LDA)、決策樹(decision tree)、傅立葉分析(Fourier analysis)等。這些方法是基於編碼區所具有的獨特信號,如剪接的供體和受體位點、起始和終止密碼子、啟動子特徵、轉錄因子結合位點等進行預測。相關的基因預測軟體包括:Procrustes、GeneID、GenScan、GRAIL等。

C. DNA基因識別技術

當人類基因組研究進入一個系統測序階段時,急需可靠自動的基因組序列注釋方法和技術,以處理大量已測定的但未知功能或未經注釋的DNA序列,例如,將序列分為基因、啟動子、轉錄調控區等。基因組注釋的一個首要問題是找出所有的基因。對於基因組DNA序列中的基因識別方法,人們已研究了近二十年,這是生物信息學領域里的一個重要研究內容。由於DNA測序技術的迅速發展,我們已經得到一些完整的基因組序列,有效地解決基因識別問題顯得越來越迫切。基因識別中的一個關鍵問題是預測編碼區域。所謂編碼區域預測,一般是指預測DNA序列中編碼蛋白質的部分,即基因的外顯子部分。而基因識別的最終目標是預測完整的基因結構,正確地識別出一個基因的所有外顯子及其邊界。

識別DNA序列中蛋白質編碼區域的方法主要有兩類。一類是基於特徵信號的識別。真核基因外顯子(編碼區域)具有一些特別的序列信號,如內部的外顯子被剪切接受體位點和給體位點所界定,5』-端的外顯子一定是在核心啟動子(Core Promoter,例如TATA盒)的下游,而3』-端的外顯子的下游包含多聚A信號和終止編碼。根據這些序列特徵信號確定外顯子的邊界,從而達到識別編碼區域的目的。 然而沒有一個演算法在預測基因時僅僅檢測這些信號,因為這些信號的強度太弱,它們缺乏統計的顯著性。另一類是基於統計度量的方法,對編碼區進行統計特性分析。通過統計而獲得的經驗說明,DNA中密碼子的使用頻率不是平均分布的,某些密碼子會以較高的頻率使用,而另一些則較少使用。這樣就使得編碼區的序列呈現出可察覺的統計特異性,即「密碼子偏好性(codon biases)」。利用這一特性對未知序列進行統計學分析可以發現編碼區的粗略位置。統計度量方法主要包括:密碼子使用傾向(codon usage)、雙聯密碼統計度量(dicodon statistic measure)、核苷酸周期性分析(即分析同一個核苷酸在3,6,9,…位置上周期性出現的規律)、基因組中等值區(isochore)的分析等。

最初基因分析方法是進行簡單的核苷酸統計,而後加上剪切保守位點的檢測。以後採用了人工神經網路、隱馬爾柯夫模型等先進的信息處理和分析技術,並與同源序列搜索結合起來,通過與已知基因序列或者EST序列的比較,提高基因識別的准確率。基因識別方法又可以分成兩大類,即從頭算方法(或基於統計的方法)和基於同源序列比較的方法。從頭算方法根據蛋白質編碼基因的一般性質和特徵進行識別,通過統計值區分外顯子、內含子及基因間區域。基於同源的方法利用資料庫中現有與基因有關的信息(如EST序列、蛋白質序列),通過同源比較,幫助發現新基因。對於新的DNA序列,搜索與已知蛋白質、EST相似的區域,發現編碼區域。最理想的方法是綜合兩大類方法的優點,開發混合演算法。常見的編碼區分析工具通常將多種技術組合起來,給出對編碼區的綜合判別,如利用下文介紹的神經網路方法等。

5.5.1 最長ORFs法

對於任何給定的核酸序列(單鏈DNA或mRNA),根據密碼子的起始位置,可以按照三種方式進行解釋。例如,對於序列ATTCGATCGCAA,一種可能的密碼子閱讀順序為ATT、CGA、TCG、CAA,另外兩種可能的密碼子閱讀順序分別為A、TTC、GAT、CGC、AA和AT、TCG、ATC、GCA、A。這三種閱讀順序稱為閱讀框(reading frames)。一個開放閱讀框(ORF, open reading frame)是一個沒有終止編碼的密碼子序列。

可以用最長ORFs法識別原核基因。原核基因結構相對比較簡單,其基因識別任務的重點是識別開放閱讀框,或者說是識別長的編碼區域。辨別序列是編碼區域或是非編碼區域的一種方法是檢查終止密碼子的出現頻率。由於一共有64個密碼子,其中3個是終止密碼子,因此,如果一條核酸序列是均勻隨機分布的,那麼終止密碼子出現的期望次數為每21(»64/3)個密碼子出現一次終止密碼子。每個編碼區域只存在一個終止密碼子,該密碼子作為編碼區域的結束標志。因此,如果能夠找到一個比較長的序列,其相應的密碼子序列不含終止密碼子,那麼這段序列可能就是編碼區域。在實現基於上述思想的演算法時,掃描給定的DNA序列,在三個不同的閱讀框中尋找較長的ORF;當遇到終止密碼子以後,回頭尋找起始密碼子,以確定完整的編碼區域。

大部分早期的DNA序列數據來自於線粒體或細菌基因組,最早的基因識別方法就是針對這類序列數據而發展起來的。一個簡單的演算法,如果它能夠發現較長的ORF,並使用長度閾值(例如300bp),則該演算法將檢測到大多數基因,並且具有很好的特異性。當然,這種演算法比較簡單,不適合處理短的ORF或者交疊的ORF。

5.5.2 基於密碼子出現頻率的預測方法

真核基因遠比原核基因復雜,一方面,真核基因的編碼區域是非連續的,編碼區域被分割為若干個小片段。另一方面,真核基因具有更加豐富的基因調控信息,這些信息主要分布在基因上游區域。為了確定基因在一段序列上所處的位置,需要首先找出基因兩端的功能區域,即轉錄啟動區和終止區,然後在啟動區下游位置尋找翻譯起始密碼子,從而確定基因起始位置。為了取出外顯子,而將內含子剔除,必須識別轉錄剪切位點,即剪切給體位點和剪切接受體位點。

必須清楚,要想設計一個100%識別編碼區域的程序幾乎是不可能的。問題是如何提高一個識別演算法的敏感性Sn和特異性Sp。Sn 和Sp都應該比較高,若一個演算法的測試結果僅僅一個很高,而另一個很低,則該演算法是不成功的。例如,假設有一個識別編碼區域的演算法,它將所有介於AG和GT之間的序列片段都找出來作為識別結果,那麼該演算法的敏感性Sn將達到100%,但其特異性Sp卻近似於0%。因此,對於一個識別演算法,往往用敏感性和特異性的平均值作為衡量其准確率的指數,即(Sn+Sp)/2。在一般情況下,調整程序的參數,使得Sn»Sp。

真核DNA序列中基因的識別是一個復雜的問題,一種方法是首先通過統計分析預測編碼區域,挑選出候選的外顯子,然後利用動態規劃方法構造最優的基因結構,這個最優的基因結構被定義為一個外顯子一致的鏈。然而,直接運用這種方法會遇到概念上和計算上的困難。每一個候選的基因由許多統計參數來刻畫,但還不清楚如何將這些統計參數組合到一個打分函數中。這個問題在一定程度上可以用神經網路來解決,運用神經網路為每個候選的外顯子打分,或將神經網路與動態規劃相結合,從而構造最優基因結構。然而使用標準的動態規劃隱含說明僅僅考慮具有加和性的打分,而許多序列分析表明用非線性的函數有時會得到更好的效果。矢量動態規劃方法為利用非線性函數提供了可能。矢量動態規劃構造一組基因,並確保其中包含滿足自然單調條件的函數所對應的最優基因。

這里首先介紹一種根據各個密碼子出現頻率識別編碼區域的方法。例如,亮氨酸、丙氨酸、色氨酸分別有6個、4個和1個密碼子,將一個隨機均勻分布的DNA序列翻譯成氨基酸序列,則在氨基酸序列中上述3種氨基酸出現的比例應該為6:4:1。但是,在真實的氨基酸序列中,上述比例並不正確。這說明DNA的編碼區域並非隨機序列。

假設在一條DNA序列中已經找到所有的ORF,那麼,可以利用密碼子頻率進一步區分編碼ORF和非編碼ORF。將每個ORF轉換為相應的密碼子序列,得到一個64個狀態的馬爾柯夫鏈。這里,為每個密碼子分配一個狀態,狀態轉換概率即為一個密碼子跟隨在其他密碼子後面的概率。利用這種方法,可以計算一個ORF成為編碼區域的可能性。

在識別編碼區域的馬爾柯夫鏈模型中,一個密碼子出現的概率依賴於其前面一個密碼子。下面考慮另一個簡單的統計模型,在該模型中,假設相繼的密碼子是獨立的,不存在前後依賴關系。令fabc代表密碼子abc在編碼區域出現的頻率。給定一個不知道閱讀框的編碼序列a1,b1,c1, a2,b2,c2,…, an+1,bn+1, 對於從密碼子a1b1c1開始的閱讀框,其n個密碼子的出現概率為

同樣,在第二種和第三種閱讀框中,n個密碼子出現的概率分別如下

令Pi代表第i個閱讀框成為編碼閱讀框的概率,其值按下列公式計算:

在設計演算法時,在給定的核酸序列上移動一個長度為n的窗口,對窗口內的每個序列片段按上式計算Pi,並根據Pi的值識別編碼的閱讀框。軟體包CGC中的Codon Preference程序採用的就是這種方法。

可以將密碼子使用偏性作為編碼區域的一種統計特性。對現有的大量序列數據進行分析,不難發現:外顯子和內含子在密碼子的出現上存在著明顯的差異。

在一個基因中,第i個(i=1,64)密碼子相對使用傾向RSCUi的定義如下:

其中Obsi是該基因中第i個密碼子實際出現的次數,而Expi是對應密碼子期望的出現次數。

åaai是統計的第i個密碼子出現的次數,åsyni是所有與第i個密碼子同義密碼子出現的次數。RSCU值大於1表示相應密碼子出現的次數比期望次數高,而小於1則表示出現次數相對較少。

實驗說明,連續的6個核苷酸出現頻率的對比是預測一個窗口是否屬於編碼區域或非編碼區域的最好的單個指標。若編碼窗口的長度至少為50 bp,則最好的編碼預測准確率約為70%。假設一段DNA序列為S,從S的第i位到第j位的雙聯密碼統計度量IF6(i,j)定義為:

其中,fk是從第k位開始的雙聯密碼的頻率,Fk是該雙聯密碼隨機出現的頻率。這里假設j的取值為大於等於6。

此外,利用密碼子第三位的偏性,也可以預測編碼區域。這種方法的准確率取決於對已知基因的統計,統計樣本數必須足夠多。

利用各種統計編碼度量,可以預測一段DNA序列是否是編碼區域。許多編碼區域識別演算法都是基於這種思想的。

分析實例:

D. 預測編碼的ADPCM

進一步改善量化性能或壓縮數據率的方法是採用自適應量化或自適應預測,即自適應脈沖編碼調制(ADPCM)。它的核心想法是:①利用自適應的思想改變數化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值,②使用過去的樣本值估算下一個輸入樣本的預測值,使實際樣本值和預測值之間的差值總是最小。
自適應量化
在一定量化級數下減少量化誤差或在同樣的誤差條件下壓縮數據,根據信號分布不均勻的特點,希望系統具有隨輸入信號的變化區間足以保持輸入量化器的信號基本均勻的能力,這種能力叫自適應量化。
自適應量化必須有對輸入信號的幅值進行估值的能力,有了估值才能確定相應的改變數。若估值在信號的輸入端進行,稱前饋自適應;若在量化輸出端進行,稱反饋自適應。信號的估值必須簡單,佔用時間短,才能達到實時處理的目的。
自適應預測
預測參數的最佳化依賴信源的特徵,要得到最佳預測參數顯然是一件繁瑣的工作。而採用固定的預測參數往往又得不到較好的性能。為了能使性能較佳,又不致於有太大的工作量,可以採用自適應預測。
為了減少計算工作量,預測參數仍採用固定的,但此時有多組預測參數可供選擇,這些預測參數根據常見的信源特徵求得。編碼時具體採用哪組預測參數需根據特徵來自適應地確定。為了自適應地選擇最佳參數,通常將信源數據分區間編碼,編碼時自動地選擇一組預測參數,使該實際值與預測值的均方誤差最小。隨著編碼區間的不同,預測參數自適應地變化,以達到准最佳預測。 幀間預測編碼是利用視頻圖像幀間的相關性,即時間相關性,來達到圖像壓縮的目的,廣泛用於普通電視、會議電視、視頻電話、高清晰度電視的壓縮編碼。
在圖像傳輸技術中,活動圖像特別是電視圖像是關注的主要對象。活動圖像是由時間上以幀周期為間隔的連續圖像幀組成的時間圖像序列,它在時間上比在空間上具有更大的相關性。大多數電視圖像相鄰幀間細節變化是很小的,即視頻圖像幀間具有很強的相關性,利用幀所具有的相關性的特點進行幀間編碼,可獲得比幀內編碼高得多的壓縮比。對於靜止圖像或活動很慢的圖像,可以少傳一些幀,如隔幀傳輸,未傳輸的幀,利用接收端的幀存儲器中前一幀的數據作為該幀數據,對視覺沒有什麼影響。因為人眼對圖像中靜止或活動慢的部分,要求有較高的空間解析度,而對時間解析度的要求可低些。這種方法叫幀重復方法,廣泛應用於視頻電話、視頻會議系統中,其圖像幀速率一般為1~15幀/秒。
採用預測編碼的方法消除序列圖像在時間上的相關性,即不直接傳送當前幀的像素值,而是傳送x和其前一幀或後一幀的對應像素x' 之間的差值,這稱為幀間預測。當圖像中存在著運動物體時,簡單的預測不能收到好的效果,例如當前幀與前一幀的背景完全一樣,只是小球平移了一個位置,如果簡單地以第k-1幀像素值作為k幀的預測值,則在實線和虛線所示的圓內的預測誤差都不為零。如果已經知道了小球運動的方向和速度,可以從小球在k-1幀的位置推算出它在k幀中的位置來,而背景圖像(不考慮被遮擋的部分)仍以前一幀的背景代替,將這種考慮了小球位移的k-1幀圖像作為k幀的預測值,就比簡單的預測准確得多,從而可以達到更高的數據壓縮比。這種預測方法稱為具有運動補償的幀間預測。
具有運動補償的幀間預測編碼是視頻壓縮的關鍵技術之一,它包括以下幾個步驟:首先,將圖像分解成相對靜止的背景和若干運動的物體,各個物體可能有不同的位移,但構成每個物體的所有像素的位移相同,通過運動估值得到每個物體的位移矢量;然後,利用位移矢量計算經運動補償後的預測值;最後對預測誤差進行量化、編碼、傳輸,同時將位移矢量和圖像分解方式等信息送到接收端。
在具有運動補償的幀間預測編碼系統中,對圖像靜止區和不同運動區的實時完善分解和運動矢量計算是較為復雜和困難的。在實際實現時經常採用的是像素遞歸法和塊匹配法兩種簡化的辦法。
像素遞歸法的具體作法是,仍需通過某種較為簡單的方法首先將圖像分割成運動區和靜止區。在靜止區內像素的位移為零,不進行遞歸運算;對運動區內的像素,利用該像素左邊或正上方像素的位移矢量D作為本像素的位移矢量,然後用前一幀對應位置上經位移D後的像素值作為當前幀中該像素的預測值。如果預測誤差小於某一閾值,則認為該像素可預測,無需傳送信息;如果預測誤差大於該閾值,編碼器則需傳送量化後的預測誤差、以及該像素的地址,收、發雙方各自根據量化後的預測誤差更新位移矢量。由此可見,像素遞歸法是對每一個像素根據預測誤差遞歸地給出一個估計的位移矢量,因而不需要單獨傳送位移矢量給接收端。
塊匹配法是另一種更為簡單的運動估值方法。它將圖像劃分為許多子塊,並認為子塊內所有像素的位移量是相同的,這意味著將每個子塊視為一個「運動物體」。對於某一時間t,圖像幀中的某一子塊如果在另一時間t-t1的幀中可以找到若干與其十分相似的子塊,則稱其中最為相似的子塊為匹配塊,並認為該匹配塊是時間t-t1的幀中相應子塊位移的結果。位移矢量由兩幀中相應子塊的坐標決定。
考慮到一定時間間隔內物體可能的運動速度、運動范圍和匹配搜索所需的計算量,在匹配搜索時一般僅在一個有限范圍內進行。假設在給定時間間隔內最大可能的水平和垂直位移為d h和d v個像素,則搜索范圍SR為
其中M、N為子塊的水平和垂直像素數。
在塊匹配方法中需要解決兩個問題:一是確定判別兩個子塊匹配的准則;二是尋找計算量最少的匹配搜索演算法。判斷兩個子塊相似程度的准則可以利用兩個塊間歸一化的二維互相關函數、兩子塊間亮度的均方差MSE或兩子塊間亮度差絕對值的均值MAD等。通過對不同判別准則的比較研究表明,各種判別准則對位移矢量的估值精度影響差別不是很大。由於MAD准則的計算不含有乘法和除法運算而成為最常使用的匹配判別准則。MAD准則定義如下:
其中Xk和Xk-1分別表示圖像在第k幀和第k-1幀的像素值。當MAD最小時,表示兩個子塊匹配。
對於匹配搜索演算法,最簡單和直接的方法就是全搜索方式,即將第k-1幀中的子塊在整個搜索區內逐個像素移動,每移動一次計算一次判決函數。總的移動次數為 (2d h + 1)(2d v + 1)。當d h = d v = 6時,總的計算次數為169。顯然,全搜索的運算量是相當大的。為了加快搜索過程,人們提出了許多不同的搜索方法,其中應用較廣的有二維對數法、三步法、共軛方向法和正交搜索法。這幾種方法都基於如下的假設:當偏離最小誤差方向時,判決函數是單調上升的,搜索總沿著判決函數值減小的方向進行。上述幾種方案所需的搜索步驟和計算點數略有差異,但基本思路是一致的。
通過上面介紹的兩種運動矢量估值方法可以看出,像素遞歸法對每一個像素給出一個估計的位移矢量,因而對較小面積物體的運動估值較為精確。但像素遞歸法在估值時需要進行疊代運算,從而存在著收斂速度和穩定性問題。塊匹配法對同一子塊內位移量不同的像素只能給出同一個位移估值,限制了對每一像素的估值精度。但對於面積較大的運動物體而言,採用塊匹配法的預測要比採用像素遞歸法的預測效果好。另外,從軟硬體實現角度看,塊匹配演算法相對簡單,在實際活動圖像壓縮編碼系統中得到較為普遍的應用。 在具有運動補償的預測編碼系統中,利用了活動圖像幀間信息的相關性,通過對相鄰幀圖像的預測誤差進行編碼而達到壓縮數據的目的。運動補償技術的引入,大大提高了預測精度,使傳輸每一幀圖像的平均數據量進一步降低。在此系統中圖像的傳輸幀率並沒有變化,仍與編碼前的幀率一樣。然而在某些應用場合如可視電話、視頻會議等,對圖像傳輸幀率的要求可適當降低,這就為另外一種稱為幀間內插的活動圖像壓縮編碼方法提供了可能。
活動圖像的幀間內插編碼是在系統發送端每隔一段時間丟棄一幀或幾幀圖像,而在接收端再利用圖像的幀間相關性將丟棄的幀通過內插恢復出來,以防止幀率下降引起閃爍和動作不連續。恢復丟棄幀的一個簡單辦法是利用線性內插,設x(i, j), y(i, j)分別代表兩個傳輸幀中相同空間位置上像素的亮度,在中間第n個內插幀對應位置的亮度z(i, j) 可用如下的內插公式:
n=1,2,3,……N-1
其中N為兩個傳輸幀之間的幀間隔數。
簡單線性幀間內插的缺點在於當圖像中有運動物體時,兩個傳輸幀在物體經過的區域上不再一一對應,因而引起圖像模糊。為解決這一問題可採用帶有運動補償的幀間內插。具有運動補償的幀間內插和幀間預測都需要進行運動估值,但二者的目的和運動估值不準確所帶來的影響不完全相同。
在幀間預測中引入運動補償的目的是為了減少預測誤差,從而提高編碼效率。運動估值的不準確會使預測誤差加大,從而使傳輸的數據率上升,但接收端據此位移矢量和預測誤差解碼不會引起圖像質量下降。而在幀間內插中引入運動補償的目的,是使恢復的內插幀中的運動物體不致因為內插而引起太大的圖像質量下降。這是由於在丟棄幀內沒有傳送任何信息,要確定運動物體在丟棄幀中的位置必須知道該物體的運動速度。運動估值的不準確,將導致內插出來的丟棄幀圖像的失真。另外,在幀間內插中的位移估值一般要對運動區的每一個像素進行,而不是對一個子塊;否則,內插同樣會引起運動物體邊界的模糊。因此,在幀間內插中較多使用能夠給出單個像素位移矢量的像素遞歸法。
其他還有閾值法(只傳送像素亮度的幀間差值超過一定閾值的像素)、幀內插(對於活動緩慢的圖像,利用前後兩幀圖像進行內插,得到預測圖像,然後對幀差信號進行編碼)、運動估計與補償等。

E. 預測編碼的基本方法是什麼

預測編碼是根據離散信號之間存在著一定關聯性的特點,利用前面一個或多個信號預測下一個信號進行,然後對實際值和預測值的差(預測誤差)進行編碼。如果預測比較准確,誤差就會很小。在同等精度要求的條件下,就可以用比較少的比特進行編碼,達到壓縮數據的目的。
脈沖編碼調制(PCM,pulse code molation)是概念上最簡單、理論上最完善的編碼系統。它是最早研製成功、使用最為廣泛的編碼系統,但也是數據量最大的編碼系統。
PCM的編碼原理比較直觀和簡單,如(1)所示。它的輸入是模擬信號,首先經過時間采樣,然後對每一樣值都進行量化,作為數字信號的輸出,即PCM樣本序列x(0),x(1),…,x(n)。圖中的「量化,編碼」可理解為「量化階大小(step-size)」生成器或者稱為「量化間隔」生成器。

折疊量化
量化有多種方法。最簡單的是只應用於數值,稱為標量量化,另一種是對矢量(又稱為向量)量化。標量量化可歸納成兩類:一類稱為均勻量化,另一類稱為非均勻量化。理論上,標量量化也是矢量量化的一種特殊形式。採用的量化方法不同,量化後的數據量也就不同。因此,可以說量化也是一種壓縮數據的方法。
折疊標量量化
均勻量化
如果採用相等的量化間隔處理采樣得到的信號值,那麼這種量化稱為均勻量化。均勻量化就是採用相同的「等分尺」來度量采樣得到的幅度,也稱為線性量化,如(2)所示。量化後的樣本值Y和原始值X的差 E=Y-X 稱為量化誤差或量化雜訊。

非均勻量化

用均勻量化方法量化輸入信號時,無論對大的輸入信號還是小的輸入信號一律都採用相同的量化間隔。為了適應幅度大的輸入信號,同時又要滿足精度要求,就需要增加量化間隔,這將導致增加樣本的位數。但是,有些信號(例如話音信號),大信號出現的機會並不多,增加的樣本位數就沒有充分利用。為了克服這個不足,就出現了非均勻量化的方法,這種方法也叫做非線性量化。

非線性量化的基本想法是,對輸入信號進行量化時,大的輸入信號採用大的量化間隔,小的輸入信號採用小的量化間隔,這樣就可以在滿足精度要求的情況下用較少的位數來表示。量化數據還原時,採用相同的規則。

在語音信號的非線性量化中,采樣輸入信號幅度和量化輸出數據之間定義了兩種對應關系,一種稱為m律壓擴(m-law companding)演算法,另一種稱為A律(A-law)壓擴演算法。

1.m 律壓擴

G.711標准建議的m律壓擴主要用在北美和日本等地區的數字電話通信中,按下面的式子(歸一化)確定量化輸入和輸出的關系:

式中:x為輸入信號幅度,規格化成 -1≤< /SPAN> x≤ 1;

sgn(x)為x的極性,x<0時為-1,否則為1;

m為確定壓縮量的參數,它反映最大量化間隔和最小量化間隔之比,取100≤ m≤ 500,多取 m =255。

由於m律壓擴的輸入和輸出關系是對數關系,所以這種編碼又稱為對數PCM。具體計算時,用m=255,可以把對數曲線變成8條折線以簡化計算過程。

2.A律壓擴

G.711標准建議的A律壓擴主要用在中國大陸和歐洲等地區的數字電話通信中,按下面的式子確定量化輸入和輸出的關系:

0 ≤ | x| ≤ 1/A

1/A < |x| ≤ 1

式中:x為輸入信號幅度,規格化成 -1 ≤< /SPAN > x ≤ 1;

sgn(x)為x的極性,x<0時為-1,否則為1;

A為確定壓縮量的參數,它反映最大量化間隔和最小量化間隔之比,通常取A=87.6。

A律壓擴的前一部分是線性的,其餘部分與m律壓擴相同。A律壓擴具有與m律壓擴相同的基本性能(在大信號區信噪比高於m律量化器,但在小信號區不如m律量化器)和實現方面的優點,尤其是還可以用直線段很好地近似,以便於直接壓擴或數字壓擴,並易於與線性編碼格式相互轉換。具體計算時,A=87.56,為簡化計算,同樣把對數曲線部分變成13條折線。

對於采樣頻率為8 kHz,樣本精度為13比特、14比特或者16比特的輸入信號,使用m率壓擴編碼或者使用A率壓擴編碼,經過PCM編碼器之後每個樣本的精度為8比特,輸出的數據率為64 kbps。這個數據就是CCITT推薦的G.711標准:話音頻率脈沖編碼調制(Pulse Code Molation (PCM) of Voice Frequencies)。通常的聽覺主觀感覺認為8位壓擴量化有不低於12位均勻量化A/D的信噪比及動態范圍。

折疊

閱讀全文

與預測編碼區域的最簡單方法是相關的資料

熱點內容
審計案例分析的方法 瀏覽:162
excel表格畫任意劃線的方法步驟 瀏覽:486
薄荷葉菊花泡水正確方法 瀏覽:550
如何用簡單的方法去除小黑蟲 瀏覽:197
最簡單的套筒方法 瀏覽:406
抹灰的重量計算方法 瀏覽:315
乒乓球桌底座安裝方法 瀏覽:969
澱粉白度檢測方法食品夥伴網 瀏覽:745
手鼓的使用方法視頻 瀏覽:952
電腦屏保動態視頻怎麼設置在哪裡設置方法 瀏覽:188
素描拿筆的方法有哪些 瀏覽:307
移門櫃安裝方法 瀏覽:399
慢性咳嗽的治療方法 瀏覽:990
科學研究論文方法 瀏覽:679
隔空給手機充電的方法 瀏覽:700
數學因式分解方程的方法怎麼用 瀏覽:644
雙層彈簧臂力器正確鍛煉方法 瀏覽:507
硬裝吊頂安裝方法 瀏覽:900
面料四級拼白檢測方法 瀏覽:679
學術史的研究方法 瀏覽:744