導航:首頁 > 研究方法 > 對圖像的分析方法

對圖像的分析方法

發布時間:2022-01-07 08:54:29

① 圖像識別中應該如何選擇分析方法

gfsdfg吧

② 圖像處理的常用方法有哪幾個

1、圖像變換:


由於圖像陣列比較大,如果直接在空間域中進行圖像處理,這樣涉及的計算量會比較大。因此,我們一般採用各種圖像變換的方法,如沃爾什變換、傅立葉變換、離散餘弦變換等一些間接處理技術,將空間域的處理轉變為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進行數字濾波處理)。


2、圖像編碼壓縮:


圖像編碼壓縮技術能夠減少描述圖像的數據量,從而可以節省圖像傳輸、處理時間和減少所佔用的存儲器容量。圖像編碼壓縮能夠在不失真的基礎上獲得,同時也可以在允許的失真條件下開始。編碼是壓縮技術中最重要的方法,它在圖像處理技術中是發展最早且比較成熟的技術。


3、圖像增強和復原:


圖像增強和復原的目的是為了提高圖像的質量,如去除雜訊,提高圖像的清晰度等。圖像增強不考慮圖像降質的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節明顯;如強化低頻分量可減少圖像中雜訊影響。圖像復原要求對圖像降質的原因有一定的了解,一般講應根據降質過程建立“降質模型”,再採用某種濾波方法,恢復或重建原來的圖像。


4、圖像分割:


圖像分割是數字圖像處理中的關鍵技術之一。圖像分割是將圖像中有意義的特徵部分提取出來,其有意義的特徵有圖像中的邊緣、區域等,這是進一步進行圖像識別、分析和理解的基礎。雖然目前已研究出不少邊緣提取、區域分割的方法,但還沒有一種普遍適用於各種圖像的有效方法。


關於圖像處理的常用方法,青藤小編就和您分享到這里了。如果您對圖片處理、網站設計等有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於平面設計的技巧及素材等內容,可以點擊本站的其他文章進行學習。

③ 圖像處理的圖像分析

從圖像中抽取某些有用的度量、數據或信息。目的是得到某種數值結果,而不是產生另一個圖像。圖像分析的內容和模式識別、人工智慧的研究領域有交叉,但圖像分析與典型的模式識別有所區別。圖像分析不限於把圖像中的特定區域按固定數目的類別加以分類,它主要是提供關於被分析圖像的一種描述。為此,既要利用模式識別技術,又要利用關於圖像內容的知識庫,即人工智慧中關於知識表達方面的內容。圖像分析需要用圖像分割方法抽取出圖像的特徵,然後對圖像進行符號化的描述。這種描述不僅能對圖像中是否存在某一特定對象作出回答,還能對圖像內容作出詳細描述。
圖像處理的各個內容是互相有聯系的。一個實用的圖像處理系統往往結合應用幾種圖像處理技術才能得到所需要的結果。圖像數字化是將一個圖像變換為適合計算機處理的形式的第一步。圖像編碼技術可用以傳輸和存儲圖像。圖像增強和復原可以是圖像處理的最後目的,也可以是為進一步的處理作準備。通過圖像分割得出的圖像特徵可以作為最後結果,也可以作為下一步圖像分析的基礎。
圖像匹配、描述和識別對圖像進行比較和配准,通過分制提取圖像的特徵及相互關系,得到圖像符號化的描述,再把它同模型比較,以確定其分類。圖像匹配試圖建立兩張圖片之間的幾何對應關系,度量其類似或不同的程度。匹配用於圖片之間或圖片與地圖之間的配准,例如檢測不同時間所拍圖片之間景物的變化,找出運動物體的軌跡。
從圖像中抽取某些有用的度量、數據或信息稱為圖像分析。圖像分析的基本步驟是把圖像分割成一些互不重疊的區域,每一區域是像素的一個連續集,度量它們的性質和關系,最後把得到的圖像關系結構和描述景物分類的模型進行比較,以確定其類型。識別或分類的基礎是圖像的相似度。一種簡單的相似度可用區域特徵空間中的距離來定義。另一種基於像素值的相似度量是圖像函數的相關性。最後一種定義在關系結構上的相似度稱為結構相似度。
以圖片分析和理解為目的的分割、描述和識別將用於各種自動化的系統,如字元和圖形識別、用機器人進行產品的裝配和檢驗、自動軍事目標識別和跟蹤、指紋識別、X光照片和血樣的自動處理等。在這類應用中,往往需綜合應用模式識別和計算機視覺等技術,圖像處理更多的是作為前置處理而出現的。
多媒體應用的掀起,對圖像壓縮技術的應用起了很大的推動作用。圖像,包括錄像帶一類動態圖像將轉為數字圖像,並和文字、聲音、圖形一起存儲在計算機內,顯示在計算機的屏幕上。它的應用將擴展到教育、培訓和娛樂等新的領域。

④ 圖像分析的分析過程

如圖為一個分級的圖像分析過程的模型。圖像分析基本上有四個過程。①感測器輸入:把實際物景轉換為適合計算機處理的表達形式,對於三維物景也是把它轉換成二維平面圖像進行處理和分析(見圖像表示)。②分割:從物景圖像中分解出物體和它的組成部分(見圖像分割)。組成部分又由圖像基元構成。把物景分解成這樣一種分級構造,需要應用關於物景中對象的知識。一般可以把分割看成是一個決策過程,它的演算法可分為像點技術和區域技術兩類。像點技術是用閾值方法對各個像點進行分類,例如通過像點灰度和閾值的比較求出文字圖像中的筆劃。區域技術是利用紋理、局部地區灰度對比度等特徵檢出邊界、線條、區域等,並用區域生長、合並、分解等技術求出圖像的各個組成成分。此外,為了進一步考察圖像整體在分割中的作用,還研究出鬆弛技術等方法。③識別:對圖像中分割出來的物體給以相應的名稱,如自然物景中的道路、橋梁、建築物或工業自動裝配線上的各種機器零件等。一般可以根據形狀和灰度信息用決策理論和結構方法進行分類,也可以構造一系列已知物體的圖像模型,把要識別的對象與各個圖像模型進行匹配和比較。④解釋:用啟發式方法或人機交互技術結合識別方法建立物景的分級構造,說明物景中有些什麼物體,物體之間存在什麼關系。在三維物景的情況下,可以利用物景的各種已知信息和物景中各個對象相互間的制約關系的知識。例如,從二維圖像中的灰度陰影、紋理變化、表面輪廓線形狀等推斷出三維物景的表面走向;也可根據測距資料,或從幾個不同角度的二維圖像進行景深的計算,得出三維物景的描述和解釋。

⑤ 基本圖像分析

grayscale image---->灰度圖像的意思

了解了圖像原理之後,我們就介紹分別有哪些圖像的種類,而這些圖像又以檔案的形式儲存在硬碟裡面,或者傳輸於網路之上.
關於檔案格式的最主要考量就是壓縮的方法,我們介紹壓縮的分類與應用上的考量.
數點陣圖像的像素 (1/2)
這是一份所謂 320 x 200 的圖,它的「寬度」(Width) 有 320 像素 (pixels),「高度」 (Height) 有 200 條線 (lines).
先解釋像素 (pixel).一張像這個小丑圖的數點陣圖像,其實是由一堆小粒小粒的色綵排出來的.
每一小粒色彩代表一個單一的顏色,這些不同的顏色湊在一起,被我們看到,就在腦袋裡產生了意義,因而認出來這是一個化了妝的小丑.
每一小粒色彩,用一個,兩個,或三個數來紀錄,稱為一個「像素」.
數點陣圖像的像素 (2/2)
所謂 320 x 200 的圖,就是寬有 320 個像素,高有 200條線 的圖,想像那些像素排成一個矩形,總共有 64,000 個像素.
230 x 200 的像素矩形太大了,所以我們故意把它縮小成一張 40 x 25 的圖.
如果覺得它太小了看不見,可以放大八倍 (寬和高各放大 8 倍) 來看看.
256 色圖
縮小的小丑圖是一張『256 色』圖,寬有 40 個像素,高有 25 個像素.每個像素用一個介於 1 和 256 之間的數表示.
256 色圖
『256 色』圖的像素代表的不是色彩,而是色彩的編號.以這張小丑圖為例,它一共只用到 81 種不同的顏色.
灰階圖 (1/2)
現在展示一張灰階的小丑圖.它的寬度是 320,高度是 200,也就是仍然有 64,000 個像素,但是此時是個『灰階』圖,每個像素就直接紀錄那個位置的灰色亮度.
我們可以觀察,這張『灰階』圖的像素數值與『256 色』圖的像素數值相同,電腦只是將像素的數值解釋成『亮度』,就造成了這張圖.
灰階圖 (2/2)
『灰階』圖不需要另外儲存色盤,每個像素直接紀錄那個位置的灰色亮度.因為電腦知道,譬如說 64 號亮度的 RGB 亮度就是 (64, 64, 64).為了能夠列出像素的數值,我們還是只看那張縮小的黑白版小丑圖 .
高彩圖
所謂『高彩』圖就是同一張圖裡面可以顯示不超過 65,536 種不同的顏色.很顯然地,像小丑圖這種總共只有 64,000 個像素的圖,不太可能用到這麼多不同的顏色.『高彩』圖的每個像素要用兩個數表示,每個數都介於 0 和 255 之間.
…..
全彩圖
所謂的『全彩』圖就是同一張圖裡面可以顯示所有可能的色彩,也就是 255 x 255 x 255 共約一千六百萬色.很顯然地,像小丑圖這種總共只有 64,000 個像素的圖,根本不可能用到這麼多不同的顏色 (每個像素只代表一個顏色).

圖像的『資料量』
所謂圖像的『資料量』就是一張數點陣圖像在記憶體內所佔有的空間.
資料量越大的圖像,通常在螢幕上看起來越大,色彩也越豐富,但是它佔用的記憶體就越多.
視覺上我們認為數點陣圖像有兩個維度:寬 (Width) 和高 (Height).
現在要接受一個新的概念:數點陣圖像其實有三個維度:除了寬度和高度之外,還有『深度』或者『厚度』.
而數點陣圖像的資料量,就是這三個維度的乘積,也就是體積.
數點陣圖像的深度
決定圖像資料量的第三個維度就是選用的色彩豐富程度,術語稱作深度 (Depth).
其實深度就是每個像素代表幾個數的意思.色彩最單調的就是『灰階』圖,它的深度是 1.
比『灰階』圖多一點點色彩的是『256 色』圖,它的深度理論上也是 1,因為每個像素只代表一個數:色盤上的編號.
但是因為含有色盤的關系,經驗上我們就說其深度是 1.01.這是一個我不打算講清楚細節的地方.
『高彩』圖的深度是 2,『全彩』圖的深度是 3.
圖像的資料量
一張數點陣圖像的資料量,就是上述寬,高,深所形成的立方體體積,而單位是 Byte (『字元』或『位元組』).電腦的術語中,稱 1024 Byte 為一個『千』Byte,記做 KB (kilo-byte);又稱 1024 個 KB,或者大約一百萬個 Byte 為 MB (mega-byte).
以一張 320 x 200 的『灰階』圖為例,其資料量就是 320 * 200 * 1 = 64,000 byte 也就是 62.5KB.
以一張 320 x 200 的『全彩』圖為例,其資料量就是 320 * 200 * 3 = 192000 byte 也就是 187.5KB.
檔案與壓縮
在這張圖像,軟體和檔案之間的關系示意圖上,我們看到電腦以『檔案』的形式儲存數點陣圖像於磁碟機內,或者傳輸數點陣圖像於網際網路上.
負責儲存或傳輸的是作業系統 (OS),例如 MS-Windows 98, ME, XP 之類的.
但是負責展現圖像的軟體,例如 MS-IE,檔案總管,ACDsee 或 PhotoImpact 之類的,卻要負責把檔案內容轉換成像素的數值,若是遇到『256 色』圖,還要處理色盤.
壓縮比
檔案通常不會一五一十地儲存像素 (和色盤) 所對應的數值,而是儲存經過壓縮的像素數值.
壓縮的過程其實是按照一種數學函數,把像素的數值按照函數規則映射到另一種數值.
我們使用電腦,應該已經知道每個檔案的性質之中,有所謂的『檔案大小』,也是用 Byte 作單位來計量.
壓縮之後的數點陣圖像通常會變得比較小,也就是說檔案大小應該會小於圖像的資料量.變小的比率就是『壓縮比』.
無失真(Lossless)壓縮與破壞性(Losssy)壓縮 (1/2)
無失真壓縮與破壞性壓縮 (2/2)
圖片格式的壓縮法 (1/2)
圖片格式的壓縮法 (2/2)
圖像的呈現
在這個可愛的動畫裡面,我們提示:是監視器『跑去拿』VRAM 裡面的指示,而不是電腦將指示從 VRAM 『送給』監視器.監視器每隔一小段時間就去電腦裡面拿 VRAM 裡面的指示,然後按照只是在螢幕上掃射各種不同的顏色.因為它掃得很快,我們的眼睛因為視覺暫留的關系,就覺得那個畫面是靜止的.
像素和光點
像素和光點之間的對應,正常的時候是 1 對 1,也就是一個像素就對應一粒光點.讓我們重溫縮小版的小丑圖,當像素與光點是正常地 1:1 的時候,實在是很小,看不見.如果有必要的話,軟體可以讓一個像素對應更多粒光點,例如 1:64.這就是『強迫放大』一張圖像的效果.雖然圖像的畫面是放大了,不過一點也沒有變得比較清楚.
所謂監視器的『解析度』就是每列有幾個光點,一共有幾列光點.例如 800 x 600 的解析度就是在監視器上,每列有 800 個光點,一共 600 列.
影像媒體
影像原理
影像格式
數點陣圖像導論
圖片JPEG影像類型討論
圖形壓縮,解壓縮探討JPEG 原理
圖片JPEG影像類型討論 (1/3)
目前影像壓縮的方法有很多種,基本上可以分為「無失真」及「有失真」兩類.例如我們常見的PCX ,GIF ,TIFF ,及TGA 等格式就是屬於無失真的影像壓縮格式.
它們利用傳統檔案的壓縮原理及技術來處理影像壓縮,所以壓縮前的原始影像與壓縮後還原的結果絲毫不差.
至於我們所熟知的 JPEG (Joint Photographic Coding Expert Group) 則是屬於有失真的影像壓縮格式.
圖片JPEG影像類型討論 (2/3)
JPEG 由國際標准組織(International Organization for Standardization ,簡稱ISO) 和國際電話電報諮詢委員會( International Telegraph and Telephone Consultative Committee ,簡稱CCITT) 所建立的一個數位影像壓縮標准,主要是用於靜態影像壓縮方面.
JPEC 採用可失真(Lossy) 編碼法的概念,利用數位餘弦轉換法(Discrete Cosine Transform,簡稱DCT) 將影像資料中較不重要的部份去除,僅保留重要的資訊,以達到高壓縮率的目的.
雖然被JPEC 處理後的影像會有失真的現象,但由於JPEG 的失真比例可以利用參數來加以控制;一般而言,當壓縮率( 即壓縮過後的體積除以原有資料量的結果) 在5% ~15% 之間時,JPEC 依然能保證其適當的影像品質,這是一般無失真壓縮法所作不到的.
圖片JPEG影像類型討論 (3/3)
我們將以下圖的陽明山風景為例,利用不同的JPEC 壓縮參數(PHOTOIMPACT 5.0 漸進式 1024 X 768)來壓縮它,其壓縮的結果如圖二和圖三.圖二的影像品質與原圖十分接近,而壓縮率已達65% ;至於圖三,其壓縮率為25% ,壓縮效果良好,但此時影像品質已經有明顯的失真了.
JPEG100 原圖100%_ 671K
JPEG65 壓縮65%_ 341K
JPEG25 壓縮25% 261K
JPEG原理 (1/3)
JPEG所根據的原理是:人的眼睛對影像中亮度的變化最為敏感,遠遠超過對顏色變化的感覺,所以,JPEG儲存的,並不是一點一點的顏色,而是亮度及顏色的"變化率".藉著變化速率的曲線的還原,來重現大部分的影像,尤其是影像的"感覺".
對大部分JPEG型態的壓縮來說,第一步要先將RGB轉換成亮度與色度,最常見的是CCIR601格式,也就是所謂Y,Cb,,Cr格式,Y代表亮度,Cb代表藍色色度,Cr代表紅色色度( 也可用U代表Cb, V代表Cr,即所謂YUV格式),轉換公式如下:
Y = 0.299R + 0.587G + 0.114B
Cb = 0.1687R – 0.3313G + 0.5B
Cr = 0.5R – 0.4187G – 0.0813B
這是一個不會失真的轉換,Y,Cb,Cr還是可以完全轉換回R,G,B的.
JPEG原理 (2/3)
由於人眼對亮度遠比對色度敏感,所以在壓縮和重建影像時,可以用份量較多的Y,而減少Cb 及Cr的份量.
轉換後的數值,仍然是一個圖點一個圖點的格式.必須將相鄰近的點合並,透過DCT(Discrete Cosine transform)轉換,將點資料轉換成"變化速率"的曲線資料,再將這曲線數位化(這就就是造成JPEG失真所在的地方) .
數位化時所用的系數,決定了資料流失量的多寡,及影像品質的好壞,這些被數位化後的資料,還可以再用Huffman或其他編碼方式,予以壓縮,存成JPEG檔案.還原的步驟剛好逆其道而行.
首先,將JPEG資料解壓縮,變成變化速率數位曲線,然後使用逆向的DCT轉換,重建影像.原本一些低階的位元,可能無法重現,都用0加以補足.
JPEG原理 (3/3)
由於Y,Cb,Cr的重要性不同,JPEG允許三者各自賦予不同的份量.例如:以一個2x2點矩陣(共4個圖點)來說,Y值最好有4個(共有4個圖點),但Cb,Cr各自只記錄一個(平均值),這樣一來,原本在RGB模式,需要4x3=12 bytes的資料,現在只需要4+1+1=6 bytes,無形中節省了50%的空間,但影響影像品質並沒有太多.
致於DCT,其實是有點類似傅立葉轉換,將原本屬於振幅強度的資料陣列,轉換成強度變化頻率的資料陣列.
JPEG使用線性數位化,也就是每一個DCT轉換值,都被一個不同的數位化系數去除,再四拾五入到一個整數,以儲存起來.在這個過程中,變化率陣列的每一個元素,將會視其頻率大小,除以一個不同的系數.
對人眼來說,比較緩慢的變化,會比快速變化更被注意.這個過程會把資料的長度大幅降低.所以變化率越大的元素,壓縮比越大.這也就是JPEG對於不規則影像( 如電視畫面,照片等)比較有利的地方.
影像媒體
影像原理
影像格式
數點陣圖像導論
圖片JPEG影像類型討論
圖形壓縮,解壓縮探討JPEG 原理
圖形壓縮,解壓縮探討JPEG 原理
JPEG是一種對彩色或灰階之類連續色調圖形作壓縮和解壓縮的標准.
這個標準是由ISO/IEC JTC1/SC29 WG10所訂定.JPEG可應用在許多如研討畫圖片,彩色電傳,影像資料庫,桌上出版系統,多媒體及醫療等的靜態影像的壓縮之上.
JPEG最基本的概念就是將影像的一個區塊從空間域轉換為頻率域.一般而言影像高頻部份的量會比低頻部份要小得多.
而由於人們的眼睛對空間高頻的部份較不敏感,因此高頻部份就可以用較大量化處理的方式來產生較為粗略的影像來表示,由於較粗略的影像需要較少的位元,於是可以大幅度地減少要儲存或通訊的資訊量,而縮減後的資訊影像也的確可以為人們的視覺感官所接受.
影像壓縮原理
資料的壓縮方法可分為無損壓縮 (lossless compression) 與略損壓縮(lossy compression)兩類.
對於資料本身在壓縮後再還原必須保持原貌的需求上,必須使用無損壓縮,無損壓縮有不得失真的限制,因此壓縮效果有限.對於文數字,程式等資料型態適用.
影像資料的一個特性是空間冗餘(Spatial Rendancy).
一般來說,在同一張畫面上必有一些共通特性(Correlation),也許是色彩上的,也許是幾何上的,或是其它特徵值得到的.
所謂的空間冗餘去除,就是要識別出畫面中重要的元素,並移除重復且較無影響的元素的動作.
影像壓縮方法概說 (1/2)
首先介紹一種基本的壓縮方法: 稱為變動長度編碼法(Run Length Encoding,簡稱RLE).
其原理是把資料中重復多次的內容,記錄其內容細節與出現約次數.例如: ABCDEABCDEABCDEABODE,我們可記錄ABCDE出現4次,兩項資訊,是不是比直接記錄重復的ABCDE要精簡呢
變動長度編碼法的演演算法相當簡單,除了可以直接應用外也可以與其他壓縮方法搭配.
但變動長度編碼法不一定能達到壓縮的效果,有時候遇到重復性很低的資料,壓過的大小可能不減反增.
影像壓縮方法概說 (2/2)
In order to understand the correlation between pixels in an image and hence decide which data to eliminate mathematical transforms are used.
目前使用在影像壓縮的最普及數學轉換為離散餘弦轉換 (DCT,Discrete Cosine Transform) .
DCT是用來分析影像資料中較不重要的部分,然後用量化(Quantization)方法將其去除,僅保留重要資訊,來達到高壓縮的效果,
而其失真比例可以利用量化參數來加以控制.此方法用於JPEG格式之影像,當壓縮比在5% ~ 15%間時,依然能保證其適當的影像品質.此一壓縮方法的發展,讓影像媒體的儲存與應用更加地方便.
JPEG Compression with Different Quality
Original
QF=20
QF=50
QF=30
QF=80
QF=10
原圖與壓縮圖比較
原圖與壓縮圖比較 cont'd
原圖與壓縮圖比較 cont'd
原圖與壓縮圖比較 cont'd
原圖與壓縮圖比較 cont'd
原圖與壓縮圖比較 cont'd
Subjective View of Titanic
Baseline JPEG Encoding
Convert to
8x8 block
Subtract
128 in pixel
DCT
Transform
Quantize
Zigzag/
RLC
Entropy
Encode
DPCM
Encode
DC coefficient
AC Range: -1023 ~ 1023
DC Range: 0 ~ 2048
JPEG 編碼及解碼器
8X8
像素
區塊
FDCT
編碼資料流
JPEG
語法
產生器
無失真壓縮
霍夫曼編碼
失真壓縮
量化處理
斜向
掃描
量化表
霍夫曼
編碼表
FDCT:Forward Discrete Transform(正離散餘弦轉換)
8X8
像素
區塊
IDCT
編碼資料流
JPEG
語法
產生器
無失真壓縮
霍夫曼編碼
反量化
斜向
掃描
量化表
霍夫曼
編碼表
IDCT:Inverse Discrete Transform(逆離散餘弦轉換)
JPEG編碼方式
為了因應不同的通訊及儲存狀況下之應用,JPEG提供二四種不同的編碼方式:
1,循序模式 (Sequential mode)
2,漸進模式(Progressive mode)
3,層模式(Hierarchical mode)
4,無失真模式(Losslessmode)
1,循序模式(Sequential mode)
循序模式編碼的方式將影像以掃瞄方式由左至右由上而下作編碼,這個循序模式的編碼架構簡單而有效率,對大部份的應用程式是相當合宜的,架構僅對資料作單一次處理的方式作影像編碼的工作,也就是所謂的循序編碼的模式了.這種方式對每個輸入資料提供8位元的解析度.
Sequential Coding Example
Sequential Coding Example
2,漸進模式(Progressive mode)
影像的建立無論是採取從模糊的低頻影像到清晰的高頻影像 (即頻譜選擇 方式),或是自最大有效位元到最小有效位元的建立方式(即連續近似法), 漸進模式的編碼都對影像作多重掃描來作處理.以頻譜選擇方式為例,影 像以DCT轉換到頻率域,而一些頻寬可立即從DCT系數得到,由於只執行一次DCT,因此在這樣的方式下只有一種的空間解析度.漸進模式對於在頻寬受到限制的頻道上作影像傳輸相當有用,使用者可以先看到粗略的影像,再決定是否需要最終的影像.
漸進模式解壓縮後影像呈現的方式,先出現模糊的低頻影像,而後再顯現清晰的高頻影像.這種的編碼方式滿足了許多應用程式漸進呈現顯示,算術編碼以及對解析度 (如12位元)的較高需求,算術編碼法提供了比Huffman編碼法有5-10%更好的壓縮.
另外此模式也對循序編碼和八位元的解析度提供了支援.
Progressive Coding Example
Progressive Coding Example
3,階層模式(Hierarchical mode)
階層模式的編碼方式乃是將影像以低空間解析度的影像先作編碼,再以此低解析度影像為基礎對較高解析度影像與低解析度影像問的差異作編碼以得到較高解析度的編碼影像.
相同一個影像可以以階層模式作好幾種不同解析度的編碼,階層模式可以同時滿足各種具有不同容量的設備上,使得即使低價的設備也可以將此一多解析度的影像作解碼後得到其所能達到的最佳品質.
相較之下.漸進模式只能採用單一解析度作影像的重建與顯現,階層模式的確為各種不同的設備提供了更佳的強性與解析度.
Hierarchical Coding Example
4,無失真模式 (Lossless Mode)
所謂的無失真表示了此模式可以將影像原原本本地將影像還原重建回來.
為了重建時能得到和原來完全一樣的影像,在無失真模式下並沒有使用DCT,也因此無失真模式的壓縮率比使用DCT作壓縮處理的失真方式要低得多.
這種模式一般只用在一些如重要的醫療影像等對影像有無失真需求的場合之中,而各個像素的數值從二位元到十六位元都可以.
另外這種的處理模式對循序編碼也提供支援,使用者可選擇Huffman編碼或算術編碼的方式作處理.
Lossless Coding
Predictor
Entropy Encoder
Huffman
Table
Source Image
Compressed Data
Lossless encoder
亮度與色度 (1/2)
雖然JPEG並未對色彩空間作規劃,但大部份的JPEG應用程式都不用RGB的表示方式.而以YCbCr來表示;另外,也由於人的視力系統對色度的敏銳度比較不高 .
因此以 YCbCr 色度的方式來表示可以再做一次作取樣(Subsampling) 來減低資訊量,這也是普遍使用YCbCr.另一個重要的理由.如下圖所示的.
4:4:4格式代表 YCbCr 原來完整的資訊.而色度表示法可以再次取樣以4:2:2或4:2:0格式來表達;4:2:2格式將原本的資訊旦減少為三分之二.
而4:2:0格式則可以將資訊三減少為一半.雖然色度的資訊量減少了.但對人的視覺神經而言卻僅僅感受到微小的差別而已.
亮度與色度 (2/2)
離散餘弦轉換
為了說明執行離散餘弦轉換 (DCT: Discrete Cosine Transform)的影響,我們將以自一張圖取下的一個小區塊 (8X8像素)的亮度資料,並將之轉換成空間頻率域,而後再自每個像素值中減去128以期每個像素都可以符合在DCT演演算法中的8位元運算范圍.經過轉換後的二維 (2D)系數如下所示,這個2D頻率域的橫軸以fx表示而縱軸以fy來表示;左上角代表DC的系數值 -80,低頻部份包含了區塊的大部份能量.而對人眼較不敏感的高頻部份,則通常含有較低的能量.
0
0
0
-2
-4
0
8
0
-2
-2
0
0
0
6
0
12
0
0
-2
0
-4
6
8
-2
0
-2
4
10
-6
-2
0
8
-2
4
4
-4
-12
0
-4
10
2
0
0
0
12
8
-8
24
0
-2
-2
2
6
-6
4
-80
量化 (1/2)
以下所列為 JPEG所建議的量化(Quantization)矩陣,以期能對每秒 30個 720X576像素畫面的 CCIR-601 標准作影像的處理與顯示.
這個矩陣的目的是在對亮度(Luminance)是作量化處理,至於色度(Chrominance)系數則還有另一個矩陣做處理.
99
103
100
112
98
95
92
72
101
120
121
103
87
78
64
49
92
113
104
81
64
55
35
24
77
103
109
68
56
37
22
18
62
80
87
51
29
22
17
14
56
69
57
40
24
16
13
14
55
60
58
26
19
14
12
12
61
51
40
24
16
10
11
16
量化 (2/2)
在亮度系數的量化方面,每個 2D DCT 系數除以相對的量化矩陣的值,在四捨五入後得到如下的量化後 DCT 系數:
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
-1
0
0
1
0
0
0
0
1
1
-1
2
0
0
0
0
0
0
0
-5
舉例來說,DC系數 -80除以其所相對應值16後得到量化值 -5.注意量化後區塊高頻部份出現許多零值,代表人類視覺系統對高頻部份並不敏感.由於四捨五入的部份並不能在解碼時重現,因此這個步驟將是個失真的過程.
斜向掃描 (Zigzag Scanning) (1/2)
區塊在量化之後,只有低頻的部份有非零值,為了能進一步地減少儲存空間與通訊容量的大小.
盡可能地將零值放在一起,使得處理時能以幾個零來表示而非個別的處理每個零.
因此運用如下圖的方式做斜向掃描 (zigzag scan),這種斜向掃描的掃描線乃是沿著空間頻率大小增加的方向作掃描的.
使得許多的零可以被串接在一起,達到原來的期望.
斜向掃描(2/2)
對量化後系數作斜向掃描的情形,斜向掃描僅針對AC系數部份作處理.
也就是跳過左上角DC系數的部份,至於DC系數的部分則另行以下圖的方式與其所相鄰的區塊作掃描.
字流長度與霍夫曼編碼法
掃描完成後,接下來的工作便運用字流長度 (Run length)與霍夫曼(Huffman)編碼法混用的方式,以期使得位元的數量能夠達到最佳化的目的.首先自斜向掃描處理取得序列的AC系數,如上例得到以下數列:0,2,1,-1,0,0,1,0,1,1,0,0,1,0,0,0,-1,0,0,-1,..,0,而後字流長度或稱為變動長度(Variable length)編碼對這個序列作編碼以更進一步地降低所需的位元數,編碼的數值所得到的是由零值的數目按著非零值的數所構成,而得到如下的編碼序列格式:
(字流中零值的數目,下個非零值的數)
因此,如上面的例子就可以編碼成:(1,2) ,(0,1) , (0,-1) , (2,1) , (1,1) , (0,1),(0,1),(2,1),(3,-1),End of Block (EOB) 來表示;而後再以霍夫曼編碼減少為了要代表字流長度編碼的位元數.
霍夫曼編碼是依統計所推論出來讓最常用的碼以最少的位元數來表示,JPEG為亮度與色度的DC及AC的霍夫曼編碼提供了一個表格以為處理之需;另外在作階層模式或無失真模式編碼時,也可藉以算術編碼表的運用來取代霍夫曼編碼表.

⑥ 圖像的特徵提取都有哪些演算法

常用的圖像特徵有顏色特徵、紋理特徵、形狀特徵、空間關系特徵。

一 顏色特徵

(一)特點:顏色特徵是一種全局特徵,描述了圖像或圖像區域所對應的景物的表面性質。一般顏色特徵是基於像素點的特徵,此時所有屬於圖像或圖像區域的像素都有各自的貢獻。由於顏色對圖像或圖像區域的方向、大小等變化不敏感,所以顏色特徵不能很好地捕捉圖像中對象的局部特徵。另外,僅使用顏色特徵查詢時,如果資料庫很大,常會將許多不需要的圖像也檢索出來。顏色直方圖是最常用的表達顏色特徵的方法,其優點是不受圖像旋轉和平移變化的影響,進一步藉助歸一化還可不受圖像尺度變化的影響,基缺點是沒有表達出顏色空間分布的信息。

(二)常用的特徵提取與匹配方法

(1) 顏色直方圖

其優點在於:它能簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所佔的比例,特別適用於描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。其缺點在於:它無法描述圖像中顏色的局部分布及每種色彩所處的空間位置,即無法描述圖像中的某一具體的對象或物體。

最常用的顏色空間:RGB顏色空間、HSV顏色空間。

顏色直方圖特徵匹配方法:直方圖相交法、距離法、中心距法、參考顏色表法、累加顏色直方圖法。

(2) 顏色集

顏色直方圖法是一種全局顏色特徵提取與匹配方法,無法區分局部顏色信息。顏色集是對顏色直方圖的一種近似首先將圖像從 RGB顏色空間轉化成視覺均衡的顏色空間(如 HSV 空間),並將顏色空間量化成若干個柄。然後,用色彩自動分割技術將圖像分為若干區域,每個區域用量化顏色空間的某個顏色分量來索引,從而將圖像表達為一個二進制的顏色索引集。在圖像匹配中,比較不同圖像顏色集之間的距離和色彩區域的空間關系

(3) 顏色矩

這種方法的數學基礎在於:圖像中任何的顏色分布均可以用它的矩來表示。此外,由於顏色分布信息主要集中在低階矩中,因此,僅採用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達圖像的顏色分布。

(4) 顏色聚合向量

其核心思想是:將屬於直方圖每一個柄的像素分成兩部分,如果該柄內的某些像素所佔據的連續區域的面積大於給定的閾值,則該區域內的像素作為聚合像素,否則作為非聚合像素。

(5) 顏色相關圖

二 紋理特徵

(一)特點:紋理特徵也是一種全局特徵,它也描述了圖像或圖像區域所對應景物的表面性質。但由於紋理只是一種物體表面的特性,並不能完全反映出物體的本質屬性,所以僅僅利用紋理特徵是無法獲得高層次圖像內容的。與顏色特徵不同,紋理特徵不是基於像素點的特徵,它需要在包含多個像素點的區域中進行統計計算。在模式匹配中,這種區域性的特徵具有較大的優越性,不會由於局部的偏差而無法匹配成功。作為一種統計特徵,紋理特徵常具有旋轉不變性,並且對於雜訊有較強的抵抗能力。但是,紋理特徵也有其缺點,一個很明顯的缺點是當圖像的解析度變化的時候,所計算出來的紋理可能會有較大偏差。另外,由於有可能受到光照、反射情況的影響,從2-D圖像中反映出來的紋理不一定是3-D物體表面真實的紋理。

例如,水中的倒影,光滑的金屬面互相反射造成的影響等都會導致紋理的變化。由於這些不是物體本身的特性,因而將紋理信息應用於檢索時,有時這些虛假的紋理會對檢索造成「誤導」。

在檢索具有粗細、疏密等方面較大差別的紋理圖像時,利用紋理特徵是一種有效的方法。但當紋理之間的粗細、疏密等易於分辨的信息之間相差不大的時候,通常的紋理特徵很難准確地反映出人的視覺感覺不同的紋理之間的差別。

(二)常用的特徵提取與匹配方法

紋理特徵描述方法分類

(1)統計方法統計方法的典型代表是一種稱為灰度共生矩陣的紋理特徵分析方法Gotlieb 和 Kreyszig 等人在研究共生矩陣中各種統計特徵基礎上,通過實驗,得出灰度共生矩陣的四個關鍵特徵:能量、慣量、熵和相關性。統計方法中另一種典型方法,則是從圖像的自相關函數(即圖像的能量譜函數)提取紋理特徵,即通過對圖像的能量譜函數的計算,提取紋理的粗細度及方向性等特徵參數

(2)幾何法

所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特徵分析方法。紋理基元理論認為,復雜的紋理可以由若干簡單的紋理基元以一定的有規律的形式重復排列構成。在幾何法中,比較有影響的演算法有兩種:Voronio 棋盤格特徵法和結構法。

(3)模型法

模型法以圖像的構造模型為基礎,採用模型的參數作為紋理特徵。典型的方法是隨機場模型法,如馬爾可夫(Markov)隨機場(MRF)模型法和 Gibbs 隨機場模型法

(4)信號處理法

紋理特徵的提取與匹配主要有:灰度共生矩陣、Tamura 紋理特徵、自回歸紋理模型、小波變換等。

灰度共生矩陣特徵提取與匹配主要依賴於能量、慣量、熵和相關性四個參數。Tamura 紋理特徵基於人類對紋理的視覺感知心理學研究,提出6種屬性,即:粗糙度、對比度、方向度、線像度、規整度和粗略度。自回歸紋理模型(simultaneous auto-regressive, SAR)是馬爾可夫隨機場(MRF)模型的一種應用實例。

三 形狀特徵

(一)特點:各種基於形狀特徵的檢索方法都可以比較有效地利用圖像中感興趣的目標來進行檢索,但它們也有一些共同的問題,包括:①目前基於形狀的檢索方法還缺乏比較完善的數學模型;②如果目標有變形時檢索結果往往不太可靠;③許多形狀特徵僅描述了目標局部的性質,要全面描述目標常對計算時間和存儲量有較高的要求;④許多形狀特徵所反映的目標形狀信息與人的直觀感覺不完全一致,或者說,特徵空間的相似性與人視覺系統感受到的相似性有差別。另外,從 2-D 圖像中表現的 3-D 物體實際上只是物體在空間某一平面的投影,從 2-D 圖像中反映出來的形狀常不是 3-D 物體真實的形狀,由於視點的變化,可能會產生各種失真。

(二)常用的特徵提取與匹配方法

Ⅰ幾種典型的形狀特徵描述方法

通常情況下,形狀特徵有兩類表示方法,一類是輪廓特徵,另一類是區域特徵。圖像的輪廓特徵主要針對物體的外邊界,而圖像的區域特徵則關繫到整個形狀區域。

幾種典型的形狀特徵描述方法:

(1)邊界特徵法該方法通過對邊界特徵的描述來獲取圖像的形狀參數。其中Hough 變換檢測平行直線方法和邊界方向直方圖方法是經典方法。Hough 變換是利用圖像全局特性而將邊緣像素連接起來組成區域封閉邊界的一種方法,其基本思想是點—線的對偶性;邊界方向直方圖法首先微分圖像求得圖像邊緣,然後,做出關於邊緣大小和方向的直方圖,通常的方法是構造圖像灰度梯度方向矩陣。

(2)傅里葉形狀描述符法

傅里葉形狀描述符(Fourier shape descriptors)基本思想是用物體邊界的傅里葉變換作為形狀描述,利用區域邊界的封閉性和周期性,將二維問題轉化為一維問題。

由邊界點導出三種形狀表達,分別是曲率函數、質心距離、復坐標函數。

(3)幾何參數法

形狀的表達和匹配採用更為簡單的區域特徵描述方法,例如採用有關形狀定量測度(如矩、面積、周長等)的形狀參數法(shape factor)。在 QBIC 系統中,便是利用圓度、偏心率、主軸方向和代數不變矩等幾何參數,進行基於形狀特徵的圖像檢索。

需要說明的是,形狀參數的提取,必須以圖像處理及圖像分割為前提,參數的准確性必然受到分割效果的影響,對分割效果很差的圖像,形狀參數甚至無法提取。

(4)形狀不變矩法

利用目標所佔區域的矩作為形狀描述參數。

(5)其它方法

近年來,在形狀的表示和匹配方面的工作還包括有限元法(Finite Element Method 或 FEM)、旋轉函數(Turning Function)和小波描述符(Wavelet Descriptor)等方法。

Ⅱ 基於小波和相對矩的形狀特徵提取與匹配

該方法先用小波變換模極大值得到多尺度邊緣圖像,然後計算每一尺度的 7個不變矩,再轉化為 10 個相對矩,將所有尺度上的相對矩作為圖像特徵向量,從而統一了區域和封閉、不封閉結構。

四 空間關系特徵

(一)特點:所謂空間關系,是指圖像中分割出來的多個目標之間的相互的空間位置或相對方向關系,這些關系也可分為連接/鄰接關系、交疊/重疊關系和包含/包容關系等。通常空間位置信息可以分為兩類:相對空間位置信息和絕對空間位置信息。前一種關系強調的是目標之間的相對情況,如上下左右關系等,後一種關系強調的是目標之間的距離大小以及方位。顯而易見,由絕對空間位置可推出相對空間位置,但表達相對空間位置信息常比較簡單。

空間關系特徵的使用可加強對圖像內容的描述區分能力,但空間關系特徵常對圖像或目標的旋轉、反轉、尺度變化等比較敏感。另外,實際應用中,僅僅利用空間信息往往是不夠的,不能有效准確地表達場景信息。為了檢索,除使用空間關系特徵外,還需要其它特徵來配合。

(二)常用的特徵提取與匹配方法
提取圖像空間關系特徵可以有兩種方法:一種方法是首先對圖像進行自動分割,劃分出圖像中所包含的對象或顏色區域,然後根據這些區域提取圖像特徵,並建立索引;另一種方法則簡單地將圖像均勻地劃分為若干規則子塊,然後對每個圖像子塊提取特徵,並建立索引。

⑦ 圖像處理與分類方法

(一)圖像處理方法

全景鑽孔攝像系統實現視頻圖像數字化的基礎是用C++語言編制而成的採集軟體和分析軟體。採集軟體使探測到的鑽孔視頻圖像數字化,再通過分析軟體對其中的信息圖像進行識別,完成對數字圖像和重要信息的存儲和維護。

採集軟體(圖9-17)的主要功能如下:

1)捕獲圖像。通過新建gra格式的文件捕獲視頻數據,並形成數字圖像。在進行圖像捕獲之前需設定視頻數據的工作環境(鑽孔孔徑、探頭直徑等),以滿足數據轉換的要求。

2)實時顯示。在進行圖像捕獲的同時將處理後的直觀圖像快速地顯示出來,便於實時監控數據處理過程。

3)圖像存儲。將捕獲後的數字圖像以gra文件的格式存儲於計算機硬碟中。

4)圖像識別。對某幀或某些幀圖像中的有用信息進行計算分析,從中獲得具體數據,主要包括:識別羅盤圖像並計算羅盤方位,識別深度數據。

5)深度修正。對視頻圖像中的深度數據與真實的深度進行修正。

圖9-17 數據採集軟體(BHImgCapt)

數據分析軟體(圖9-18)的主要功能如下:

1)形成三維圖像。三維圖像就是三維鑽孔岩心圖,它是通過鑽孔孔壁圖模擬出來的,也稱為「虛擬」鑽孔岩心圖,形成的三維圖像便於更直觀地觀測孔壁。

2)計算分析。計算分析的功能包括計算結構面產狀和隙寬、建立結構面資料庫、備注結構面的幾何形態等,為進一步對結構面進行統計分析創造條件。

3)列印輸出。統計分析形成的任何圖像都可以彩色列印輸出。

圖9-18 數據分析軟體(BHImgCapt)

(二)統計分類方法

為了更直觀地展現經數據採集與分析軟體獲得的孔內結構面數據(結構面產狀、深度、張開度及裂隙填充情況等)分布特徵,首先藉助 Microsoft Excel的數據統計功能將結構面數據按傾角和張開度大小進行分類匯總(表9-4和表9-5),然後用統計分析軟體Origin和DIPS繪制裂隙的傾向玫瑰花圖和產狀極點密度圖(圖9-19和圖9-20)。

表9-4 按傾角大小的分類匯總

表9-5 按隙寬大小的分類匯總

圖9-19 Origin軟體界面及傾向玫瑰花圖

圖9-20 Dips軟體界面及產狀極點密度圖

⑧ jpeg圖像隱寫分析有幾種方法

[jsteg.zip] - jsteg隱寫演算法[23][24]由D. Upham提出,該演算法將秘密信息嵌入在量化後的DCT系數的LSB上,但值為-1、0、+1的DCT系數例外。提取秘密信息時,也只是將隱藏信息的圖像中不等於-1、0、+1的量化DCT系數的LSB取出即可 [attackjsteg.rar] - 抗jsteg的隱寫分析,jsteg jpeg圖像隱寫的重要方法之一。 [kafang.zip] - 對圖像以嵌入率為rate進行順序LSB嵌入,然後進行卡方隱寫分析 [LSB-information-hiding.rar] - 設計並實現一種基於圖像的LSB卡方因襲分析方法 [JPEGjsteg.rar] - jsteg_Mu可批量對JPEG圖像進行Jsteg隱寫。 Jpeg_Or 為jpeg密寫的原始圖像的文件夾, Jpeg_Di 為jpeg密寫後密寫了的圖像的文件夾,code_file 為密寫的文件,rate 為密寫嵌入率. [RS.rar] - 信息隱藏里LSB隱寫方案的RS分析方法,附有詳細註解。

⑨ 軟體工程專業中對圖像分析包括哪些內容

摘要 黑白圖像是指像素只能是黑,灰度像是指每個像素的信息由一個量化的灰度來描述的,像沒有彩色信息。

閱讀全文

與對圖像的分析方法相關的資料

熱點內容
led電子屏安裝方法 瀏覽:801
如何找到學習方法 瀏覽:130
扁蓄食用方法 瀏覽:817
牛肚如何腌制方法 瀏覽:988
古典概型的導入方法有哪些 瀏覽:336
雞腸道發育的最佳方法 瀏覽:618
手機音量鍵在哪裡設置方法 瀏覽:18
101乘以88的簡便方法 瀏覽:457
塑身機使用方法 瀏覽:682
代購郵費的計算方法 瀏覽:435
班主任教學方法的好處 瀏覽:122
硫酸根計算方法毫克每升 瀏覽:551
熱熔塗料標線計算方法 瀏覽:60
冬天用暖氣片的最佳方法 瀏覽:595
現在人們用什麼方法來凈化空氣 瀏覽:126
鈴木國四瑞夢電腦復位方法 瀏覽:509
學滑板的最佳方法 瀏覽:386
正弦規使用方法 瀏覽:35
電飯煲的使用方法圖解 瀏覽:684
12556的簡便計算方法是什麼 瀏覽:673