① 圖像分割技術論文
圖像分割是圖像處理與計算機視覺的基本問題之一,是圖像處理圖像分析的關鍵步驟。我整理了圖像分割技術論文,歡迎閱讀!
圖像分割技術研究
摘要:圖像分割是圖像處理與計算機視覺的基本問題之一,是圖像處理圖像分析的關鍵步驟。本文介紹了基於閾值的分割方法和圖像分割的圖像分割性能的評價、應用現狀;最後總結出圖像分割的發展趨勢。
關鍵詞:圖像分割、閾值、邊緣檢測、區域分割
中圖分類號: TN957.52 文獻標識碼: A
1引言
隨著圖像分割技術研究的深入,其應用日趨廣泛。凡屬需要對圖像目標進行提取、測量的工作都離不開圖像分割。圖像分割是圖像處理、模式識別和人工智慧等多個領域中一個十分重要且又十分困難的問題,是計算機視覺技術中首要的、重要的關鍵步驟。圖像分割結果的好壞直接影響對計算機視覺中的圖像理解。現有的方法多是為特定應用設計的,有很大的針對性和局限性,到目前為止還不存在一個通用的方法,也不存在一個判斷分割是否成功的客觀標准。因此,對圖像分割的研究目前還缺乏一個統一的理論體系,使得圖像分割的研究仍然是一個極富有挑戰性的課題。
2圖像分割方法
圖像分割(Image Segmentation),簡單地說就是將一幅數字圖像分割成不同的區域,在同一區域內具有在一定的准則下可認為是相同的性質,如灰度、顏色、紋理等。而任何相鄰區域之間其性質具有明顯的區別。
2.1基於灰度特徵的閾值分割方法
閾值分割技術是經典的、流行的圖象分割方法之一,它是用一個或幾個閾值將圖像的灰度級分為幾個部分,認為屬於同一個部分的像素是同一個物體。
這類方法主要包括以下幾種:
(1)單閾值法,用一個全局閾值區分背景和目標。當一幅圖像的直方圖具有明顯的雙峰時,選擇兩峰之間的谷底作為閾值。
(2)雙閾值法,用兩個閾值區分背景和目標。通過設置兩個閾值,以防單閾值設置閾值過高或過低,把目標像素誤歸為背景像素,或把背景像素誤歸為目標像素。
(3)多閾值法,當存在照明不均,突發雜訊等因素或背景灰度變化較大時,整幅圖像不存在合適的單一閾值,單一閾值不能兼顧圖像不同區域的具體情況,這時可將圖像分塊處理,對每一塊設一個閾值。
2.2 邊緣檢測分割法
基於邊緣檢測技術可以按照處理的順序分為並行邊緣檢測和串列邊緣檢測兩大類。常見的邊緣檢測方法有:差分法、模板匹配法及統計方法等。由於邊緣灰度變化規律一般體現為階梯狀或者脈沖狀。邊緣與差分值的關系可以歸納為兩種情況,其一是邊緣發生在差分最大值或者最小值處;其二是邊緣發生在過零處。
2.3基於區域的分割方法
基於區域的分割方法利用的是圖像的空間性質。該方法認為分割出來的某一區域具有相似的性質。常用的方法有區域生長法和區域分裂合並法。該類方法對含有復雜場景或自然景物等先驗知識不足的圖像進行分割,效果較好。
區域生長方法是把一幅圖像分成許多小區域開始的,這些初始的小區域可能是小的鄰域甚至是單個像素,在每個區域中,通過計算能反映一個物體內像素一致性的特徵,作為區域合並的判斷標准。區域合並的第一步是賦給每個區域一組參數,即特徵。接下來對相鄰區域的所有邊界進行考查,如果給定邊界兩側的特徵值差異明顯,那麼這個邊界很強,反之則弱。強邊界允許繼續存在,而弱邊界被消除,相鄰區域被合並。沒有可以消除的弱邊界時,區域合並過程結束,圖像分割也就完成。
2.4結合特定工具的圖像分割技術
20世紀80年代末以來,隨著一些特殊理論的出現及其成熟,如數學形態學、分形理論、模糊數學、小波分析、模式識別、遺傳演算法等,大量學者致力於將新的概念、新的方法用於圖像分割,有效地改善了分割效果。產生了不少新的分割演算法。下面對這些演算法做一些簡單的概括。
2.4.1基於數學形態學的分割演算法
分水嶺演算法是一種經典的借鑒了數學形態理論的分割方法。該方法中,將一幅圖像比為一個具有不同高度值的地形,高灰度值處被認為是山脊,底灰度值處被認為是山谷,將一滴水從任一點流下,它會朝地勢底的地方流動,最終聚於某一局部最底點,最後所有的水滴會分聚在不同的吸引盆地,由此,相應的圖像就被分割成若幹部分。分水嶺演算法具有運算簡單、性能優良,能夠較好提取運動對象輪廓、准確得到運動物體邊緣的優點。但分割時需要梯度信息,對雜訊較敏感。
2.4.2基於模糊數學的分割演算法
目前,模糊技術在圖像分割中應用的一個顯著特點就是它能和現有的許多圖像分割方法相結合,形成一系列的集成模糊分割技術,例如模糊聚類、模糊閾值、模糊邊緣檢測技術等。
這類方法主要有廣義模糊運算元與模糊閾值法兩種分割演算法。
(1)廣義模糊運算元在廣義模糊集合的范圍內對圖像處理,使真正的邊緣處於較低灰度級,但還有一些不是邊緣的像素點的灰度也在較低灰度級中,雖然演算法的計算簡明,且邊緣細膩,但得到的邊緣圖會出現斷線問題。
(2)模糊閾值法引入灰度圖像的模糊數學描述,通過計算圖像的模糊熵來選取圖像的分割閾值,後用閾值法處理圖像得到邊界。
2.4.3基於遺傳演算法的分割方法
此演算法是受生物進化論思想提出的一種優化問題的解決方法,它使用參數編碼集而不是參數本身,通過模擬進化,以適者生存的策略搜索函數的解空間,它是在點群中而不是在單點進行尋優。遺傳演算法在求解過程中使用隨機轉換規則而不是確定性規則來工作,它唯一需要的信息是適應值,通過對群體進行簡單的復制、雜交、變異作用完成搜索過程。由於此法能進行能量函數全局最小優化搜索,且可以降低搜索空間維數,降低演算法對模板初始位置的敏感,計算時間也大為減少。其缺點是容易收斂於局部最優。
2.4.4基於神經網路分割演算法
人工神經網路具有自組織、自學習、自適應的性能和非常強的非線性映射能力,適合解決背景知識不清楚、推理規則不明確和比較復雜的分類問題,因而也適合解決比較復雜的圖像分割問題。原則上講,大部分分割方法都可用 ANN(attificial neural network)實現。ANN 用於分割的研究起步較晚,只有多層前饋NN,多層誤差反傳(BP)NN,自組織NN,Hopfield NN以及滿足約束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了應用。使用一個多層前向神經網路用於圖象分割,輸入層神經元的數目取決於輸入特徵數,而輸出層神經元的數目等同於分類的數目。
2.5圖像分割中的其他方法
前面介紹了4大類圖像分割較常用的方法,有關圖像分割方法和文獻很多,新方法不斷產生,這些方法有的只對特定的情形有效,有的綜合了幾種方法,放在一起統稱為第5類。
(1)標號法(labeling)是一種基於統計學的方法,這種方法將圖像欲分割成的幾個區域各以一個不同的標號來表示,用一定的方式對圖像中的每一個像素賦以標號,標號相同的像素就合並成該標號所代表的區域。
(2)基於Snak模型的分割方法,基於Snake模型的分割是通過對能量函數的動態優化來逼近圖像目標的真實輪廓的
(3)紋理分割,由於新的數學工具的引入,紋理分割技術取得了一些進展,張蓬等人將小波分析應用於紋理基元提取。
(4)基於知識的圖像分割方法,直接建立在先驗知識的基礎上,使分割更符合實際圖像的特點。該方法的難度在於知識的正確合理的表示與利用。
3圖像分割性能的評價
圖像分割評價主要有兩個方面的內容:一是研究各分割演算法在不同情況下的表現,掌握如何選擇和控制其參數設置,以適應不同需要。二是分析多個分割演算法在分割同一圖像時的性能,比較優劣,以便在實際應用中選取合適的演算法。分割評價方法分為分析法和實驗法兩大類。分析法是直接分析分割演算法本身的原理及性能,而實驗法是通過對測試圖像的分割結果來評價演算法的。兩種方法各有優劣,由於缺乏可靠理論依據,並非所有分割演算法都能夠通過分析法分析其性能。每種評價方法都是出於某種考慮而提出來的,不同的評價方法只能反映分割演算法性能的某一性能。另一方面,每一種分割演算法的性能是由多種因素決定的,因此,有可能需要多種准則來綜合評價。
4圖像分割技術的發展趨勢
隨著神經網路、遺傳演算法、統計學理論、小波理論以及分形理論等在圖像分割中的廣泛應用,圖像分割技術呈現出以下的發展趨勢:(1)多種特徵的融合。(2)多種分割方法的結合。(3)新理論與新方法。
參考文獻
[1] [美]RC岡薩雷斯.數字圖像處理(第二版)[M].阮秋琦,等譯.北京:電子工業出版社,2003
[2] 章毓晉.圖像分割[M].北京:科學出版社,2001.
[3] 李弼程,彭天強,彭波等.智能圖像處理技術[M].北京:電子工業出版社,2004.
[4] 楊暉,曲秀傑.圖像分割方法綜述[J].電腦開發與應用。2005,18(3):21-23.
點擊下頁還有更多>>>圖像分割技術論文
② Canny邊緣檢測演算法的步驟和理解
姓名:高強 學號:17011210057
【嵌牛導讀】:本文主要介紹Canny圖像邊緣檢測演算法的步驟和對各個步驟的理解
【嵌牛鼻子】:邊緣檢測,Canny,步驟
【嵌牛提問】:canny邊緣檢測演算法的步驟是怎樣?
【嵌牛正文】:
1. Canny邊緣檢測演算法的提出和指標
Canny演算法是John Canny在1986年提出的,那年John Canny 28歲,該文章發表在PAMI頂級期刊上(1986.IEEE Transactions on Pattern Analysis and Machine Intelligence,vol. 8, 1986 , pp 679-698 )。
Canny運算元與Marr(LoG)邊緣檢測方法類似(Marr大爺號稱計算機視覺之父),也屬於是先平滑後求導數的方法。John Canny研究了最優邊緣檢測方法所需的特性,給出了評價邊緣檢測性能優劣的三個指標:
(1)好的信噪比 ,即將非邊緣點判定為邊緣點的概率要低,將邊緣點判為非邊緣點的概率要低;
(2)高的定位性能 ,即檢測出的邊緣點要盡可能在實際邊緣的中心;
(3)對單一邊緣僅有唯一響應 ,即單個邊緣產生多個響應的概率要低,並且虛假響應邊緣應該得到最大抑制。
用一句話說,就是希望在提高對景物邊緣的敏感性的同時,可以抑制雜訊的方法才是好的邊緣提取方法。
2. Canny邊緣檢測演算法的步驟 :
(1)圖像高斯濾波進行降噪處理。
(2)用一階偏導的有限差分計算梯度的幅值和方向。
(3)對梯度幅值進行非極大值抑制。
(4)用雙閾值演算法檢測和連接邊緣。
3. Canny邊緣檢測演算法的通俗理解
Canny演算法的目的就是邊緣檢測,何為邊緣?圖象局部區域亮度變化顯著的部分,對於灰度圖像來說,也就是灰度值有一個明顯變化,既從一個灰度值在很小的緩沖區域內急劇變化到另一個灰度相差較大的灰度值。那麼怎麼表徵這種灰度值的變化呢?這里想到的就是導數微分,導數就是表徵變化率的,但是數字圖像都是離散的,也就是導數肯定會用差分來代替。也就是具體演算法中的步驟2,用相鄰像素的差分來計算梯度的大小和方向。但是在真實的圖像中,一般會有雜訊,雜訊會影響梯度的計算,所以步驟1要先濾波。理論上將圖像梯度幅值的元素值越大,說明圖像中該點的梯度值越大,但這不能說明該點就是邊緣。在Canny演算法中,步驟3的非極大值抑制是進行邊緣檢測的重要步驟,通俗意義上是指尋找像素點的局部最大值,沿著梯度方向,比較它前面和後面的梯度值,若梯度值局部最大則有可能為邊緣像素,進行保留,否則就進行抑制。步驟4是一個典型演算法,有時候我們並不能一刀切,也就是超過閾值的都是邊緣點,而是設兩個閾值,希望在高閾值和低閾值之間的點也可能是邊緣點,而且這些點最好在高閾值的附近,也就是說這些中間閾值的點是高閾值邊緣點的一種延伸。所以步驟4用了雙閾值來進行檢測和連接邊緣。雙閾值有時也叫做滯後閾值。
③ 邊緣檢測的邊緣檢測
所謂邊緣是指其周圍像素灰度急劇變化的那些象素的集合,它是圖像最基本的特徵。邊緣存在於目標、背景和區域之間,所以,它是圖像分割所依賴的最重要的依據。由於邊緣是位置的標志,對灰度的變化不敏感,,因此,邊緣也是圖像匹配的重要的特徵。邊緣檢測和區域劃分是圖像分割的兩種不同的方法,二者具有相互補充的特點。在邊緣檢測中,是提取圖像中不連續部分的特徵,根據閉合的邊緣確定區域。而在區域劃分中,是把圖像分割成特徵相同的區域,區域之間的邊界就是邊緣。由於邊緣檢測方法不需要將圖像逐個像素地分割,因此更適合大圖像的分割。 邊緣大致可以分為兩種,一種是階躍狀邊緣,邊緣兩邊像素的灰度值明顯不同;另一種為屋頂狀邊緣,邊緣處於灰度值由小到大再到小的變化轉折點處。 邊緣檢測的主要工具是邊緣檢測模板。我們以一個一維模板為例來考察邊緣檢測模板是如何作用的。模板的作用是將右鄰點的灰度值減去左鄰點的灰度值作為該點的灰度值。在灰度相近的區域內,這么做的結果使得該點的灰度值接近於0;而在邊緣附近,灰度值有明顯的跳變,這么做的結果使得該點的灰度值很大,這樣就出現了上面的結果。這種模板就是一種邊緣檢測器,它在數學上的涵義是一種基於梯度的濾波器,習慣上又稱邊緣運算元。我們知道,梯度是有方向的,和邊緣的方向總是垂直的。模板 是水平方向的,而上面那幅圖象的邊緣恰好是垂直方向的,使用模板 就可以將它檢測出來。如果圖象的邊緣是水平方向的,我們可以用梯度是垂直方向的模板 檢測它的邊緣。如果圖象的邊緣是45。方向的,我們可以用模板檢測它的邊緣。
常用的邊緣檢測模板有Laplacian運算元、Roberts運算元、Sobel運算元、log(Laplacian-Gauss)運算元、Kirsch運算元和Prewitt運算元等。
④ 圖像分析:邊緣檢測中的梯度運算元
邊緣檢測 是基於邊界的圖像分割方法的第一步,邊緣就是兩個不同的相鄰區域之間 灰度值 不連續或者突變的地方。因此,檢測邊緣就是,檢測灰度明顯變化的地方。而邊緣位置處灰度的明顯變化是可以藉助計算灰度的微分來檢測的。一般使用一階微分和二階微分檢測邊緣,在邊緣位置,一階微分的幅度值會有局部極值,二階微分的幅度值會出現過零點。本文主要介紹邊緣檢測中的一階微分運算元----梯度運算元,包括Roberts、Prewitt和Sobel三種運算元。
想要計算梯度圖,就要設計模板卷積,首先要搞明白圖像在計算時的坐標系,很多博文對應的模板和坐標系都不匹配,我們在後面的卷積操作中主要使用計算坐標系。
左圖Cameraman所用的坐標系統,常用在圖像計算中。其坐標原點在左上角,x軸是水平的,並且向右延伸;y是垂直的,並且向下延伸。 既可以代表這幅圖像,也可以表示 坐標處像素的值。
右圖Lena的坐標系統,常用在屏幕顯示中,因為屏幕掃描是從左向右,從上向下進行的,原點在圖像的左上角,縱軸標記圖像的行,橫軸標記圖像的列。 既可以代表這個圖像,也可以代表 行列交點處的圖像值。
首先我們要知道的是梯度是一個向量,向量的話有方向和大小,梯度方向指向函數變化最快的方向,大小就是它的模,也是最大的變化率。對於二元函數 ,它在點 的梯度就是 , 或者 ,就是:
其中, ,這個梯度向量的幅度和方向角為
下圖展示了一個灰度圖的數學化表達,像素點 的灰度值是 ,它有八個鄰域。
圖像在點 的梯度為
其中
即 對應圖像的水平方向, 即 對應水圖像的豎直方向。
要理解梯度圖的生成,就要先了解模板卷積的過程。
模板卷積是模板運算的一種方式,其步驟如下:
(1)將模板在輸入圖像中漫遊,並將模板中心與圖像中某個像素位置重合;
(2)將模板上各個系數與模板下各對應像素的灰度相乘;
(3)將所有乘積相加(為保持灰度范圍,常將結果再除以模板系數之和,後面梯度運算元模板和為0的話就不需要除了);
(4)將上述運算結果(模板的響應輸出)賦給輸出圖像中對應模板中心位置的像素。
其實梯度圖生成前面和模板卷積相同,不同的是要生成梯度圖,還需要在模板卷積完成後計算在點 梯度的幅值,將幅值作為像素值,這樣才算完。 。
下圖是生成梯度圖用到的的水平模板和豎直模板:
例如,如果只想生成水平方向的梯度圖,那麼只計算水平方向的梯度 ,則梯度圖上對應點 的灰度值就是
一般是水平方向的 和豎直方向的 各用一個模板,然後結合,那麼得到梯度圖在點 的灰度值就是
它就是我們上面說到的梯度的幅值,是以計算以2為范數,對應歐式距離,由於涉及平方和開方運算,計算量比較大。(怎麼簡化計算呢??換一種近似計算方式吧!!!)
在真實的梯度圖輸出計算中,採用以1為范數(對應城區距離)的簡單計算方式,即
另一種簡單的方式是以 為范數(對應棋盤距離),即
首先了解下梯度運算元的設計,一般是水平方向和豎直方向,水平方向模板轉置再對折就是豎直方向。
其本質是一個對角線方向的梯度運算元,對應的水平方向和豎直方向的梯度分別為
輸出梯度圖在 的灰度值為
優點:邊緣定位較准
缺點:(1)沒有描述水平和豎直方向的灰度變化,只關注了對角線方向,容易造成遺漏。(2)魯棒性差。由於 點本身參加了梯度計算,不能有效的抑制雜訊的干擾。
適用於邊緣明顯且雜訊較少的圖像。
Prewitt運算元是典型的 模板,其模板中心對應要求梯度的原圖像坐標 , 對應的8-鄰域的像素灰度值如下表所示:
通過Prewitt運算元的水平模板 卷積後,對應的水平方向梯度為
通過Prewitt運算元的豎直模板 卷積後,對應的豎直方向梯度為
輸出梯度圖在 的灰度值為
Prewitt運算元引入了類似局部平均的運算,對雜訊具有平滑作用,較Roberts運算元更能抑制雜訊。
通過Prewitt運算元的水平模板 卷積後,對應的水平方向梯度為
通過Prewitt運算元的豎直模板 卷積後,對應的豎直方向梯度為
輸出梯度圖在 的灰度值為
Sobel運算元引入了類似局部加權平均的運算,對邊緣的定位比要比Prewitt運算元好。
Python 調用OpenCV介面實現Sobel運算元邊緣檢測
⑤ 傳統的圖像分割方法有哪些
1.基於閾值的分割方法
灰度閾值分割法是一種最常用的並行區域技術,它是圖像分割中應用數量最多的一類。閾值分割方法實際上是輸入圖像f到輸出圖像g的變化
其中,T為閾值;對於物體的圖像元素,g(i,j)=1,對於背景的圖像元素,g(i,j)=0。
由此可見,閾值分割演算法的關鍵是確定閾值,如果能確定一個適合的閾值就可准確地將圖像分割開來。閾值確定後,閾值與像素點的灰度值比較和像素分割可對各像素並行地進行,分割的結果直接給出圖像區域。
閾值分割的優點是計算簡單、運算效率較高、速度快。在重視運算效率的應用場合(如用於軟體實現),它得到了廣泛應用。
2.基於區域的分割方法
區域生長和分裂合並法是兩種典型的串列區域技術,其分割過程後續步驟的處理要根據前面步驟的結果進行判斷而確定。
(1)區域生長
區域生長的基本思想是將具有相似性質的像素集合起來構成區域。具體先對每個需要分割的區域找一個種子像素作為生長的起點,然後將種子像素周圍鄰域中與種子像素有相同或相似性質的像素(根據某種事先確定的生長或相似准則來判定)合並到種子像素所在的區域中。將這些新像素當作新的種子像素繼續進行上面的過程,直到再沒有滿足條件的像素可被包括進來。這樣一個區域就長成了。
(2)區域分裂合並
區域生長是從某個或者某些像素點出發,最後得到整個區域,進而實現目標提取。分裂合並差不多是區域生長的逆過程:從整個圖像出發,不斷分裂得到各個子區域,然後再把前景區域合並,實現目標提取。分裂合並的假設是對於一幅圖像,前景區域是由一些相互連通的像素組成的,因此,如果把一幅圖像分裂到像素級,那麼就可以判定該像素是否為前景像素。當所有像素點或者子區域完成判斷以後,把前景區域或者像素合並就可得到前景目標。
3.基於邊緣的分割方法
基於邊緣的分割方法是指通過邊緣檢測,即檢測灰度級或者結構具有突變的地方,確定一個區域的終結,即另一個區域開始的地方。不同的圖像灰度不同,邊界處一般有明顯的邊緣,利用此特徵可以分割圖像。
4.基於特定理論的分割方法
圖像分割至今尚無通用的自身理論。隨著各學科新理論和新方法的提出,出現了與一些特定理論、方法相結合的圖像分割方法,主要有:基於聚類分析的圖像分割方法、基於模糊集理論的分割方法等。
5.基於基因編碼的分割方法
基於基因編碼的分割方法是指把圖像背景和目標像素用不同的基因編碼表示,通過區域性的劃分,把圖像背景和目標分離出來的方法。該方法具有處理速度快的優點,但演算法實現起來比較難。
6.基於小波變換的分割方法
小波變換是近年來得到廣泛應用的數學工具,它在時域和頻域都具有良好的局部化性質,並且小波變換具有多尺度特性,能夠在不同尺度上對信號進行分析,因此在圖像處理和分析等許多方面得到應用。
基於小波變換的閾值圖像分割方法的基本思想是首先由二進小波變換將圖像的直方圖分解為不同層次的小波系數,然後依據給定的分割准則和小波系數選擇閾值門限,最後利用閾值標出圖像分割的區域。整個分割過程是從粗到細,由尺度變化來控制,即起始分割由粗略的L2(R)子空間上投影的直方圖來實現,如果分割不理想,則利用直方圖在精細的子空間上的小波系數逐步細化圖像分割。分割演算法的計算會與圖像尺寸大小呈線性變化。
7.基於神經網路的分割方法
近年來,人工神經網路識別技術已經引起了廣泛的關注,並應用於圖像分割。基於神經網路的分割方法的基本思想是通過訓練多層感知機來得到線性決策函數,然後用決策函數對像素進行分類來達到分割的目的。這種方法需要大量的訓練數據。神經網路存在巨量的連接,容易引入空間信息,能較好地解決圖像中的雜訊和不均勻問題。選擇何種網路結構是這種方法要解決的主要問題。
⑥ 閾值分割和邊緣檢測實現圖像目標分割的角度有什麼不同
區別如下:
1、閾值分割是為了突出圖像中我們感興趣的部分的方法,通過二值化(或多值化)以後目標物體會以特定的灰度值呈現出來,主要側重在物體本來就已經有灰度特徵,使用閾值分割將其表現出來。邊緣檢測是為了找出物體邊緣的方法,主要側重的是通過演算法體現邊緣的灰度特徵。
2、二值閾值分割的重點在於找二值化的閾值,然後利用閾值將目標和背景分離。大多數邊緣檢測的重點在於確定差分運算元,進行鄰域內的灰度差分。
3、一般的處理過程為先邊緣檢測得到差分的灰度圖,然後使用閾值分割二值化。
4、平時我們說的這兩個概念都比較模糊,屬於有交集。邊緣的灰度本來就突出不需要演算法處理就可以直接二值化體現,那閾值分割就可以算是邊緣檢測的方法了。如果邊緣不突出需要先利用差分運算元或其他方法突出邊緣,那閾值分割只是體現邊緣的手段。
⑦ 用matlab如何通過圖像分割來檢測邊界
matlab實現邊緣檢測和圖像分割提供了很多有用的圖像處理函數,做圖像分割方法有很多,例如:基於閾值的方法,基於邊緣的方法,基於區域的方法,基於凸輪的方法以及基於能量泛函的方法。其中matlab裡面有很多做邊緣檢測的演算法,最常用的是sobel,prewitte演算法,通過該運算元與圖像的卷積運算,即可檢測到圖像邊緣,進一步分割目標區域。
⑧ 邊緣檢測的理論依據是什麼有哪些方法各有什麼特點
就是通過一些臨近像素相關演算法突出灰度變化比較大的部分。變化平緩的取值低,變化越劇烈取值越高。比如有卷積演算法,具體計算方法,有拉普拉斯運算元、高斯運算元等的應用。
⑨ 邊緣檢測的檢測邊緣
如果將邊緣認為是一定數量點亮度發生變化的地方,那麼邊緣檢測大體上就是計算這個亮度變化的導數。為簡化起見,我們可以先在一維空間分析邊緣檢測。在這個例子中,我們的數據是一行不同點亮度的數據。例如,在下面的1維數據中我們可以直觀地說在第4與第5個點之間有一個邊界:
除非場景中的物體非常簡單並且照明條件得到了很好的控制,否則確定一個用來判斷兩個相鄰點之間有多大的亮度變化才算是有邊界的閾值,並不是一件容易的事。實際上,這也是為什麼邊緣檢測不是一個微不足道問題的原因之一。
檢測方法
有許多用於邊緣檢測的方法, 他們大致可分為兩類:基於搜索和基於零交叉。
基於搜索的邊緣檢測方法首先計算邊緣強度, 通常用一階導數表示, 例如梯度模,然後,用計算估計邊緣的局部方向, 通常採用梯度的方向,並利用此方向找到局部梯度模的最大值。
基於零交叉的方法找到由圖像得到的二階導數的零交叉點來定位邊緣。 通常用拉普拉斯運算元或非線性微分方程的零交叉點。
濾波做為邊緣檢測的預處理通常是必要的,通常採用高斯濾波。
已發表的邊緣檢測方法應用計算邊界強度的度量,這與平滑濾波有本質的不同。 正如許多邊緣檢測方法依賴於圖像梯度的計算,他們用不同種類的濾波器來估計x-方向和y-方向的梯度。
計算一階導數
許多邊緣檢測操作都是基於亮度的一階導數——這樣就得到了原始數據亮度的梯度。使用這個信息我們能夠在圖像的亮度梯度中搜尋峰值。如果 I(x) 表示點 x 的亮度,I′(x) 表示點 x 的一階導數(亮度梯度),這樣我們就會發現:
對於更高性能的圖像處理來說,一階導數能夠通過帶有掩碼的原始數據(1維)卷積計算得到。
計算二階導數
其它一些邊緣檢測操作是基於亮度的二階導數。這實質上是亮度梯度的變化率。在理想的連續變化情況下,在二階導數中檢測過零點將得到梯度中的局部最大值。另一方面,二階導數中的峰值檢測是邊線檢測,只要圖像操作使用一個合適的尺度表示。如上所述,邊線是雙重邊緣,這樣我們就可以在邊線的一邊看到一個亮度梯度,而在另一邊看到相反的梯度。這樣如果圖像中有邊線出現的話我們就能在亮度梯度上看到非常大的變化。為了找到這些邊線,我們可以在圖像亮度的二階導數中尋找過零點。如果 I(x) 表示點 x 的亮度,I′′(x) 表示點 x 亮度的二階導數,那麼:
同樣許多演算法也使用卷積掩碼快速處理圖像數據:
步驟:
①濾波:邊緣檢測演算法主要是基於圖像強度的一階和二階導數,但導數的計算對雜訊很敏感,因此必須使用濾波器來改善與雜訊有關的邊緣檢測器的性能。需要指出,大多數濾波器在降低雜訊的同時也導致了邊緣強度的損失,因此,增強邊緣和降低雜訊之間需要折中。
②增強:增強邊緣的基礎是確定圖像各點鄰域強度的變化值。增強演算法可以將鄰域(或局部)強度值有顯著變化的點突顯出來。邊緣增強一般是通過計算梯度幅值來完成的。
③檢測:在圖像中有許多點的梯度幅值比較大,而這些點在特定的應用領域中並不都是邊緣,所以應該用某種方法來確定哪些點是邊緣點。最簡單的邊緣檢測判據是梯度幅值閾值判據。
④定位:如果某一應用場合要求確定邊緣位置,則邊緣的位置可在子像素解析度上來估計,邊緣的方位也可以被估計出來。在邊緣檢測演算法中,前三個步驟用得十分普遍。這是因為大多數場合下,僅僅需要邊緣檢測器指出邊緣出現在圖像某一像素點的附近,而沒有必要指出邊緣的精確位置或方向。
邊緣檢測的實質是採用某種演算法來提取出圖像中對象與背景間的交界線。我們將邊緣定義為圖像中灰度發生急劇變化的區域邊界。圖像灰度的變化情況可以用圖像灰度分布的梯度來反映,因此我們可以用局部圖像微分技術來獲得邊緣檢測運算元。經典的邊緣檢測方法,是通過對原始圖像中像素的某小鄰域構造邊緣檢測運算元來達到檢測邊緣這一目的的。
⑩ 機器視覺系統中圖像分割技術傳統方法概論1
姓名:寇世文
學號:21011110234
學院:通信工程學院
【嵌牛導讀】:隨著人工智慧技術的不斷發展,智能機器人領域也得到了空前的發展。尤其是深度神經網路廣泛應用於視覺系統中後,取得了許多很明顯的成效。對於自主移動機器人來說,視覺系統有著十分重要的作用,而圖像分割技術更是在這個系統中擔任著十分重要的角色。傳統的圖像分割技術基本上已經能夠將圖像的前景和後景分隔開來,但是近年來隨著深度學習演算法的發展,人們開始將其應用到圖像分割中,提出了很多分割網路,也達到了很好的分割效果。在實現圖像分割的基礎上,人們還使得分割具有了語義類別和標簽,就是現在的語義分割。本文在介紹了語義分割的基礎上又引出了新的任務分割場景,實例分割和全景分割。並且介紹了最近研究的熱點三維點雲的語義分割問題,闡述了其實現的必要性。
【嵌牛鼻子】智能機器人,圖像分割、語義分割、計算機視覺
【嵌牛提問】圖像分割技術的傳統常見方法
【嵌牛正文】
一、引言
計算機視覺,即computer vision,就是通過計算機來模擬人的視覺工作原理,來獲取和完成一系列圖像信息處理的機器。計算機視覺屬於機器學習在視覺領域的應用,是一個多學科交叉的研究領域,其涉及數學、物理、生物、計算機工程等多個學科。
計算機視覺的主要應用有無人駕駛、人臉識別、無人安防、車輛車牌識別、智能傳圖、3D重構、VR/AR、智能拍照、醫學圖像處理、無人機、工業檢測等。人駕駛又稱自動駕駛,是目前人工智慧領域一個比較重要的研究方向,讓汽車可以進行自主駕駛,或者輔助駕駛員駕駛,提升駕駛操作的安全性。人臉識別技術目前已經研究得相對比較成熟,並在很多地方得到了應用,且人臉識別准確率目前已經高於人眼的識別准確率。安防一直是我國比較重視的問題,也是人們特別重視的問題,在很多重要地點都安排有巡警巡查,在居民小區以及公司一般也都有保安巡查來確保安全。車輛車牌識別目前已經是一種非誠成熟的技術了,高速路上的違章檢測,車流分析,安全帶識別,智能紅綠燈,還有停車場的車輛身份識別等都用到了車輛車牌識別。3D重構之前在工業領域應用比較多,可以用於對三維物體進行建模,方便測量出物體的各種參數,或者對物體進行簡單復制。計算機視覺還有很多應用,隨著技術的發展,應用領域也會越來越多。在工業領域的應用,在機器人技術方面的應用等。
對於傳統的圖像分割過程,通常可以分為5個步驟,即特徵感知、圖像預處理、特徵提取、特徵篩選和推理預測與識別。通過研究發現,在視覺的早期的發展過程中,人們對於圖像中的特徵並沒有表現出足夠的關注。且傳統的分割過程是把特徵提取和分類分開來做的,等到需要輸出結果的時候再結合到一起,可想而知其實現的困難程度。
在深度學習演算法出來之後,卷積神經網路被廣泛應用於計算機視覺技術中,也因此衍生出了很多的研究方向。深度學習主要是以特徵為基礎來進行比對,如在人臉識別方面,使用卷積神經網路分別對兩張人臉進行不同位置的特徵提取,然後再進行相互比對,最後得到比對結果。目前的計算機視覺的主要研究方向有圖像分類、目標檢測、圖像分割、目標跟蹤、圖像濾波與降噪、圖像增強、風格化、三維重建、圖像檢索、GAN等。本文主要是針對圖像分割這一領域,進行簡要的概述。
圖像分割技術是計算機視覺領域的個重要的研究方向,是圖像語義理解的重要一環。圖像分割是指將圖像分成若干具有相似性質的區域的過程,從數學角度來看,圖像分割是將圖像劃分成互不相交的區域的過程。近些年來隨著深度學習技術的逐步深入,圖像分割技術有了突飛猛進的發展,該技術相關的場景物體分割、人體前背景分割、人臉人體Parsing、三維重建等技術已經在無人駕駛、增強現實、安防監控等行業都得到廣泛的應用。
二、發展現狀
近來已經有很多學者將圖像分割技術應用到移動機器人的控制中,能夠做到在機器人運動的同時定位、構建地圖並分割出不同的前景和後景,使視覺系統掃描到的圖像具有語義信息。並有學者也致力於分割得更為准確和精細,不僅能夠做到區分不同類的物體,也能夠實現對同類的不同物體的分類,甚至可以做到在此基礎上加上對背景的分割。由於我們生活的世界是三維空間,還有學者將圖像場景還原到三維中,然後使用相關方法對整個三維場景進行分割。作為計算機視覺的研究中的一個較為經典的難題,圖像分割這一領域也越來越被人們所關注。
首先是傳統的圖像分割方法。在傳統分割方面,人們使用數字圖像處理、拓撲學、數學等方面的知識來進行圖像分割。雖然現在的算力逐漸增加且深度學習不斷發展,一些傳統的分割方法所取得的效果不如深度學習,但是其分割的思想仍有很多值得我們去學習的。
第一種方法是基於閾值的圖像分割方法。這種方法的核心思想是想根據圖像的灰度特徵來給出一個或多個灰度閾值,將此閾值作為一個標准值與圖像中的每個像素逐一進行比較。很容易想到,通過這個逐一比較過程能夠得到兩類結果,一類是灰度值大於閾值的像素點集,另一類是灰度值小於閾值的像素點集,從而很自然地將圖像進行了分割。所以,不難發現,此方法的最關鍵的一步就是按照一定的准則函數來得到最佳灰度閾值,這樣才能夠得到合適的分類結果。值得一提的是,如果圖像中需要分割的目標和背景分別占據了不同的灰度值甚至是不同的等級,那使用這種方法會得到很好的效果。並且,假如對於一張圖像的處理,我們只需要設定一個閾值時,可以將其稱為單閾值分割。但是圖像中如果不止一個目標,即有多個目標需要進行提取的時候,單一閾值分割就無法做到將它們都分割開來,此時應選取多個閾值對其進行處理,這個分割的過程為多閾值分割。總的來說,閾值分割法有著其獨特的特點,其計算簡單、效率較高。但是,由於這種方法只考慮的是單個像素的灰度值及其特徵,而完全忽略了空間特徵,這也就導致了其對雜訊比較敏感且魯棒性不高。
第二種方法是基於區域的圖像分割方法。這種方法具有兩種基本形式:一種是區域生長,這種分割方法是從單個像素出發,逐漸將相似的區域進行合並,最終得到需要的區域。另一種方法是直接從圖像的全局出發,一點一點逐步切割至所需要的區域。區域生長指的是,給定一組種子像素,其分別代表了不同的生長區域,然後讓這些種子像素逐漸合並鄰域里符合條件的像素點。如果有新的像素點添加進來,同樣把它們作為種子像素來處理。
區域分裂合並的分割過程可以說是區域生長的逆過程,這種方法是從圖像的全局出發通過不斷分裂得到各個子區域,然後提取目標的過程。此外,在此過程中,還需要合並前景區域。
在區域分割方法中還有一種分水嶺演算法。受啟發於分水嶺的構成,這種分割方法將圖像看作是測地學上的拓撲地貌,這樣圖像中每一個像素點對應的海拔高度可以用該點的灰度值來表示。分水嶺的形成過程實際上可以通過模擬浸入過程來實現。具體做法是,在每個局部極小值的表面都刺穿一個小孔,然後把模型慢慢浸入水中,隨著水慢慢浸入其中,分水嶺就隨之形成了。
第三種方法是基於邊緣檢測的分割方法。邊緣檢測的思想就是試圖通過檢測不同物體的邊緣來將圖像分割開來,這種方法是人們最先想到的也是研究最多的方法之一。如果我們將圖片從空間域變換到頻率域中去,其中物體的邊緣部分就對應著高頻部分,很容易就能夠找到邊緣信息,因此也使得分割問題變得容易。邊緣檢測的方法能夠實現快而且准確的定位,但是其不能保證邊緣的連續性和封閉性,且當一幅圖像的細節信息過多時,其就會在邊緣處產生大量的細碎邊緣,在形成完整的分割區域時就會有缺陷。
第四種圖像分割方法結合了特定的工具。這里所說的特定工具是各種圖像處理工具以及演算法等,隨著圖像分割研究工作的深入,很多學者開始將一些圖像處理的工具和一些演算法應用到此工作中,並取得了不錯的結果。小波變換在數字圖像處理中發揮著很重要的作用,它能夠將時域和頻域統一起來研究信號。尤其是在圖像邊緣檢測方面,小波變換能夠檢測二元函數的局部突變能力。其次是基於遺傳演算法的圖像分割,遺傳演算法主要借鑒了生物界自然選擇和自然遺傳機制的隨機化搜索方法。其模擬了由基因序列控制的生物群體的進化過程,其擅長於全局搜索,但是局部搜多能力不足。將遺傳演算法應用到圖像處理中也是當前研究的一個熱點問題,在此選擇這種方法的主要原因是遺傳演算法具有快速的隨機搜索能力,而且其搜索能力與問題的領域沒有任何關系。
除此之外,還有基於主動輪廓模型的分割方法,這種方法具有統一的開放式的描述形式,為圖像分割技術的研究和創新提供了理想的框架。此方法也是對邊緣信息進行檢測的一種方法,主要是在給定圖像中利用曲線演化來檢測目標。