『壹』 目標跟蹤檢測演算法(一)——傳統方法
姓名:劉帆;學號:20021210609;學院:電子工程學院
https://blog.csdn.net/qq_34919792/article/details/89893214
【嵌牛導讀】目標跟蹤演算法研究難點與挑戰在於實際復雜的應用環境 、背景相似干擾、光照條件的變化、遮擋等外界因素以及目標姿態變化,外觀變形,尺度變化、平面外旋轉、平面內旋轉、出視野、快速運動和運動模糊等。而且當目標跟蹤演算法投入實際應用時,不可避免的一個問題——實時性問題也是非常的重要。正是有了這些問題,才使得演算法研究充滿著難點和挑戰。
【嵌牛鼻子】目標跟蹤演算法,傳統演算法
【嵌牛提問】利用目標跟蹤檢測演算法要達到何目的?第一階段的單目標追蹤演算法包括什麼?具體步驟有哪些?它們有何特點?
【嵌牛正文】
第一階段
目標跟蹤分為兩個部分,一個是對指定目標尋找可以跟蹤的特徵,常用的有顏色,輪廓,特徵點,軌跡等,另一個是對目標特徵進行跟蹤。
1、靜態背景
1)背景差: 對背景的光照變化、雜訊干擾以及周期性運動等進行建模。通過當前幀減去背景圖來捕獲運動物體的過程。
2)幀差: 由於場景中的目標在運動,目標的影像在不同圖像幀中的位置不同。該類演算法對時間上連續的兩幀或三幀圖像進行差分運算,不同幀對應的像素點相減,判斷灰度差的絕對值,當絕對值超過一定閾值時,即可判斷為運動目標,從而實現目標的檢測功能。
與二幀差分法不同的是,三幀差分法(交並運算)去除了重影現象,可以檢測出較為完整的物體。幀間差分法的原理簡單,計算量小,能夠快速檢測出場景中的運動目標。但幀間差分法檢測的目標不完整,內部含有「空洞」,這是因為運動目標在相鄰幀之間的位置變化緩慢,目標內部在不同幀圖像中相重疊的部分很難檢測出來。幀間差分法通常不單獨用在目標檢測中,往往與其它的檢測演算法結合使用。
3)Codebook
演算法為圖像中每一個像素點建立一個碼本,每個碼本可以包括多個碼元(對應閾值范圍),在學習階段,對當前像素點進行匹配,如果該像素值在某個碼元的學習閾值內,也就是說與之前出現過的某種歷史情況偏離不大,則認為該像素點符合背景特徵,需要更新對應點的學習閾值和檢測閾值。
如果新來的像素值與每個碼元都不匹配,則可能是由於動態背景導致,這種情況下,我們需要為其建立一個新的碼元。每個像素點通過對應多個碼元,來適應復雜的動態背景。
在應用時,每隔一段時間選擇K幀通過更新演算法建立CodeBook背景模型,並且刪除超過一段時間未使用的碼元。
4)GMM
混合高斯模型(Gaussian of Micture Models,GMM)是較常用的背景去除方法之一(其他的還有均值法、中值法、滑動平均濾波等)。
首先我們需要了解單核高斯濾波的演算法步驟:
混合高斯建模GMM(Gaussian Mixture Model)作為單核高斯背景建模的擴展,是目前使用最廣泛的一種方法,GMM將背景模型描述為多個分布,每個像素的R、G、B三個通道像素值的變化分別由一個混合高斯模型分布來刻畫,符合其中一個分布模型的像素即為背景像素。作為最常用的一種背景建模方法,GMM有很多改進版本,比如利用紋理復雜度來更新差分閾值,通過像素變化的劇烈程度來動態調整學習率等。
5)ViBe(2011)
ViBe演算法主要特點是隨機背景更新策略,這和GMM有很大不同。其步驟和GMM類似。具體的思想就是為每個像素點存儲了一個樣本集,樣本集中采樣值就是該像素點過去的像素值和其鄰居點的像素值,然後將每一個新的像素值和樣本集進行比較來判斷是否屬於背景點。
其中pt(x)為新幀的像素值,R為設定值,p1、p2、p3….為樣本集中的像素值,以pt(x)為圓心R為半徑的圓被認為成一個集,當樣本集與此集的交集大於設定的閾值#min時,可認為此為背景像素點(交集越大,表示新像素點與樣本集越相關)。我們可以通過改變#min的值與R的值來改變模型的靈敏度。
Step1:初始化單幀圖像中每個像素點的背景模型。假設每一個像素和其鄰域像素的像素值在空域上有相似的分布。基於這種假設,每一個像素模型都可以用其鄰域中的像素來表示。為了保證背景模型符合統計學規律,鄰域的范圍要足夠大。當輸入第一幀圖像時,即t=0時,像素的背景模型。其中,NG(x,y)表示空域上相鄰的像素值,f(xi,yi)表示當前點的像素值。在N次的初始化的過程中,NG(x,y)中的像素點(xi,yi)被選中的可能次數為L=1,2,3,…,N。
Step2:對後續的圖像序列進行前景目標分割操作。當t=k時,像素點(x,y)的背景模型為BKm(x,y),像素值為fk(x,y)。按照下面判斷該像素值是否為前景。這里上標r是隨機選的;T是預先設置好的閾值。當fk(x,y)滿足符合背景#N次時,我們認為像素點fk(x,y)為背景,否則為前景。
Step3:ViBe演算法的更新在時間和空間上都具有隨機性。每一個背景點有1/ φ的概率去更新自己的模型樣本值,同時也有1/ φ的概率去更新它的鄰居點的模型樣本值。更新鄰居的樣本值利用了像素值的空間傳播特性,背景模型逐漸向外擴散,這也有利於Ghost區域的更快的識別。同時當前景點計數達到臨界值時將其變為背景,並有1/ φ的概率去更新自己的模型樣本值(為了減少緩慢移動物體的影響和攝像機的抖動)。
可以有如下總結,ViBe中的每一個像素點在更新的時候都有一個時間和空間上隨機影響的范圍,這個范圍很小,大概3x3的樣子,這個是考慮到攝像頭抖動時會有坐標的輕微來回變化,這樣雖然由於ViBe的判別方式仍認為是背景點,但是也會對後面的判別產生影響,為了保證空間的連續性,隨機更新減少了這個影響。而在樣本值保留在樣本集中的概率隨著時間的增大而變小,這就保證了像素模型在時間上面的延續特性。
6)光流
光流是由物體或相機的運動引起的圖像對象在兩個連續幀之間的視在運動模式。它是2D矢量場,其中每個矢量是一個位移矢量,顯示點從第一幀到第二幀的移動。
光流實際上是一種特徵點跟蹤方法,其計算的為向量,基於三點假設:
1、場景中目標的像素在幀間運動時亮度(像素值或其衍生值)不發生變化;2、幀間位移不能太大;3、同一表面上的鄰近點都在做相同的運動;
光流跟蹤過程:1)對一個連續視頻幀序列進行處理;2)對每一幀進行前景目標檢測;3)對某一幀出現的前景目標,找出具有代表性的特徵點(Harris角點);4)對於前後幀做像素值比較,尋找上一幀在當前幀中的最佳位置,從而得到前景目標在當前幀中的位置信息;5)重復上述步驟,即可實現目標跟蹤
2、運動場(分為相機固定,但是視角變化和相機是運動的)
1)運動建模(如視覺里程計運動模型、速度運動模型等)
運動學是對進行剛性位移的相機進行構型,一般通過6個變數來描述,3個直角坐標,3個歐拉角(橫滾、俯仰、偏航)。
Ⅰ、對相機的運動建模
由於這個不是我們本次所要討論的重點,但是在《概率機器人》一書中提出了很多很好的方法,相機的運動需要對圖像內的像素做位移矩陣和旋轉矩陣的坐標換算。除了對相機建立傳統的速度運動模型外,也可以用視覺里程計等通關過置信度的更新來得到概率最大位置。
Ⅱ、對於跟蹤目標的運動建模
該方法需要提前通過先驗知識知道所跟蹤的目標對象是什麼,比如車輛、行人、人臉等。通過對要跟蹤的目標進行建模,然後再利用該模型來進行實際的跟蹤。該方法必須提前知道要跟蹤的目標對象是什麼,然後再去跟蹤指定的目標,這是它的局限性,因而其推廣性相對比較差。(比如已知跟蹤的物體是羽毛球,那很容易通過前幾幀的取點,來建立整個羽毛球運動的拋物線模型)
2)核心搜索演算法(常見的預測演算法有Kalman(卡爾曼)濾波、擴展卡爾曼濾波、粒子濾波)
Ⅰ、Kalman 濾波
Kalman濾波器是通過前一狀態預測當前狀態,並使用當前觀測狀態進行校正,從而保證輸出狀態平穩變化,可有效抵抗觀測誤差。因此在運動目標跟蹤中也被廣泛使用。
在視頻處理的運動目標跟蹤里,每個目標的狀態可表示為(x,y,w,h),x和y表示目標位置,w和h表示目標寬高。一般地認為目標的寬高是不變的,而其運動速度是勻速,那麼目標的狀態向量就應該擴展為(x,y,w,h,dx,dy),其中dx和dy是目標當前時刻的速度。通過kalman濾波器來估計每個時刻目標狀態的大致過程為:
對視頻進行運動目標檢測,通過簡單匹配方法來給出目標的第一個和第二個狀態,從第三個狀態開始,就先使用kalman濾波器預測出當前狀態,再用當前幀圖像的檢測結果作為觀測值輸入給kalman濾波器,得到的校正結果就被認為是目標在當前幀的真實狀態。(其中,Zt為測量值,為預測值,ut為控制量,Kt為增益。)
Ⅱ、擴展卡爾曼濾波(EKF)和無跡卡爾曼濾波(UKF)
由於卡爾曼濾波的假設為線性問題,無法直接用在非線性問題上,EKF和UKF解決了這個問題(這個線性問題體現在用測量量來計算預測量的過程中)。EKF是通過構建線性函數g(x),與非線性函數相切,並對每一時刻所求得的g(x)做KF,如下圖所示。
UKF與EKF去求解雅可比矩陣擬合線性方程的方法不同,通過對那個先驗分布中的採集點,來線性化隨機變數的非線性函數。與EKF所用的方法不同,UKF產生的高斯分布和實際高斯分布更加接近,其引起的近似誤差也更小。
Ⅲ、粒子濾波
1、初始狀態:基於粒子濾波的目標追蹤方法是一種生成式跟蹤方法,所以要有一個初始化的階段。對於第一幀圖像,人工標定出待檢測的目標,對該目標區域提出特徵;
2、搜索階段:現在已經知道了目標的特徵,然後就在目標的周圍撒點(particle), 如:a)均勻的撒點;b)按高斯分布撒點,就是近的地方撒得多,遠的地方撒的少。論文里使用的是後一種方法。每一個粒子都計算所在區域內的顏色直方圖,如初始化提取特徵一樣,然後對所有的相似度進行歸一化。文中相似性使用的是巴氏距離;
3、重采樣:根據粒子權重對粒子進行篩選,篩選過程中,既要大量保留權重大的粒子,又要有一小部分權重小的粒子;
4、狀態轉移:將重采樣後的粒子帶入狀態轉移方程得到新的預測粒子;
5、測量及更新:對目標點特徵化,並計算各個粒子和目標間的巴氏距離,更新粒子的權重;
6、決策階段:每個粒子都獲得一個和目標的相似度,相似度越高,目標在該范圍出現的可能性越高,將保留的所有粒子通過相似度加權後的結果作為目標可能的位置。
3)Meanshift演算法
MeanShift演算法屬於核密度估計法,它不需要任何先驗知識而完全依靠特徵空間中樣本點的計算其密度函數值。對於一組采樣數據,直方圖法通常把數據的值域分成若干相等的區間,數據按區間分成若干組,每組數據的個數與總參數個數的比率就是每個單元的概率值;核密度估計法的原理相似於直方圖法,只是多了一個用於平滑數據的核函數。採用核函數估計法,在采樣充分的情況下,能夠漸進地收斂於任意的密度函數,即可以對服從任何分布的數據進行密度估計。
Meanshift演算法步驟
1、通過對初始點(或者上一幀的目標點)為圓心,繪制一個半徑為R的圓心,尋找特徵和該點相似的點所構成的向量;
2、所有向量相加,可以獲得一個向量疊加,這個向量指向特徵點多的方向;
3、取步驟二的向量終點為初始點重復步驟一、二,直到得到的向量小於一定的閾值,也就是說明當前位置是特徵點密度最密集的地方,停止迭代,認為該點為當前幀的目標點;
4)Camshift演算法
Camshift演算法是MeanShift演算法的改進,稱為連續自適應的MeanShift演算法。Camshift 是由Meanshift 推導而來 Meanshift主要是用在單張影像上,但是獨立一張影像分析對追蹤而言並無意義,Camshift 就是利用MeanShift的方法,對影像串列進行分析。
1、首先在影像串列中選擇目標區域。
2、計算此區域的顏色直方圖(特徵提取)。
3、用MeanShift演演算法來收斂欲追蹤的區域。
4、通過目標點的位置和向量信息計算新的窗口大小,並標示之。
5、以此為參數重復步驟三、四。
Camshift 關鍵就在於當目標的大小發生改變的時候,此演算法可以自適應調整目標區域繼續跟蹤。
3、小結
第一階段的單目標追蹤演算法基本上都是傳統方法,計算量小,在嵌入式等設備中落地較多,opencv中也預留了大量的介面。通過上面的兩節的介紹,我們不難發現,目標檢測演算法的步驟分為兩部分,一部分是對指定目標尋找可以跟蹤的特徵,常用的有顏色,輪廓,特徵點,軌跡等,另一部分是對目標特徵進行跟蹤,如上文所提及的方法。所以目標檢測方法的發展,也可總結為兩個方面,一個是如何去獲得更加具有區分性的可跟蹤的穩定特徵,另一個是如何建立幀與幀之間的數據關聯,保證跟蹤目標是正確的。
隨著以概率為基礎的卡爾曼濾波、粒子濾波或是以Meanshift為代表向量疊加方法在目標檢測的運用,使得目標檢測不再需要假設自身的一個狀態為靜止的,而是可以是運動的,更加符合復雜場景中的目標跟蹤。
『貳』 多假設追蹤方法mht是什麼演算法
MHT演算法是多假設多目標跟蹤演算法,這種方法簡單來說就是把所有出現的目標都進行跟蹤假設,連續跟蹤幾幀之後,有些假設就站不住腳了,被「剪枝」掉。留下來的就是真實的目標跟蹤。顯然,這種方法理想情況下表現不錯,但是當目標數量很大時,計算量將呈指數倍上升。
與之對應的是另一種演算法,聯合概率數據關聯演算法(JPDA),這種傳統跟蹤演算法的基本思想是對每個檢測目標賦予與跟蹤路徑之間的關聯概率,關聯概率高的將檢測結果和跟蹤路徑相匹配。 這種演算法在雜訊高的環境下比較實用。但是也有速度瓶頸。
『叄』 教師為了檢測教學目標的達成有哪些評價方式
教學目標達成的檢測方法包括:提問、作業、測驗、考試和與學生平時的交談等。
第一,通過提問檢測。美國教育家卡爾漢認為:「提問是教師促進學生思維,評價教學效果以及推動學生實現預期目標的基本控制手段」。所以提問被教師廣泛採用成為最直接的控制手段。對於中學生,首先要克服學生發言的心理障礙。由於年齡的增長,面對新的集體,陌生的同學,開始表現為不願出頭露面,上課怕提問更不肯舉手。這是集體壓力和從眾行為在學生心理作用的結果,怕答不上來被人笑話,為了求得心理平安,不願過多地發表自己的觀點和看法。這對學生學習新知識和教師教學目標的達成檢測造成一定的困難。當然有一部分學生還保留著初中學習時的良好習慣。此時,教師應充分重視這方面的學生心理變化,一方面,要積極創設一個民主的課堂教學環境,對善於表達內心看法和積極發言的同學多給以一些語言和形體上的贊許,滿足學生成功後得到認可的要求,也為大部分學生樹立表率。其次,教師應重視提問形式,提問要把握時機,有層次、適度。形式上個人回答和集體回答、個人板演和集體練習相結合。對較簡單的識記類知識點,一般採用特指或泛指方式由個體回答,對應用性知識可採用一人主答,多人補充,以求全面恰當的答案。對於某些拓展性知識,雖然難度較大,但對學生創造能力的培養,開闊學生思路具有積極意義,因此可先組織討論,在討論過程中教師可適當加以誘導和暗示,使學生少走彎路。
教與學的雙邊活動過程中,既發揮教師的主導作用,又發揮學生的主體作用,通過提問教師及時得到信息反饋,檢驗了課時教學目標的達成程度,以便及時補救。
第二,課內外作業和測驗的檢測。課堂提問雖說能直接、真實反應學生掌握情況。但畢竟面較窄,不能反應全體學生的整體情況。所以平時作業和測驗能補救提問的不足,作業和測驗的優點就是面廣、清楚。既反應每個人的學習情況,又能反應學生整體的掌握情況。所以教師既要重視課堂提問,又要重視作業情況的反饋。
在批改作業和試卷時,應作好清晰的記載。我在這方面主要記二個數據:一是每小題的錯誤率,主要統計每班做錯人數和典型錯誤類型。在復習和講評時做到有的放矢,把時間化在錯誤率較高和典型錯誤上,既節省時間又照顧到大多數,不至於使大部分學生陪少數人重復一些簡單的知識,提高了效率。從而提高學生學習的積極性。二是記錄錯誤較高的學生名單。對錯誤較多(學習困難)的學生,主要採用面對面輔導為主,這樣才能顧及少數學習困難學生的利益,又能培養師生感情,使他們有信心學好生物。
總之,提問、作業、測驗都能檢測教學目標的達成程度,教師通過檢測來調節教學進程。教師在教學過程中,不僅要重視課堂教學的整個過程,包括目標的確立,目標的實施;更要重視目標的達成測試。只有這樣才能踏踏實實地提高教學質量,提高學生的整體素質。
『肆』 多目標決策方法的主要的方法
(1)化多為少法:將多目標問題化成只有一個或二個目標的問題,然後用簡單的決策方法求解,最常用的是線性加權和法。
(2)分層序列法:將所有目標按其重要性程度依次排序,先求出第一個最重要的目標的最優解,然後在保證前一目標最優解的前提下依次求下一目標的最優解,一直求到最後一個目標為止。
(3)直接求非劣解法:先求出一組非劣解,然後按事先確定好的評價標准從中找出一個滿意的解。
(4)目標規劃法:對於每一個目標都事先給定一個期望值,然後在滿足系統一定約束條件下,找出與目標期望值最近的解。
(5)多屬性效用法:各個目標均用表示效用程度大小的效用函數表示,通過效用函數構成多目標的綜合效用函數,以此來評價各個可行方案的優劣。
(6)層次分析法:把目標體系結構予以展開,求得目標與決策方案的計量關系。
(7)重排序法:把原來的不好比較的非劣解通過其他辦法使其排出優劣次序來。
(8)多目標群決策和多目標模糊決策等。 多目標決策一般包括多目標決策和多屬性決策,是一門應用非常廣泛的學科。目前,無論在理論上、方法上和應用方面都取得了迅速的發展。書中以方法和實例相結合,既介紹目前常用的多目標決策方法,又包含模糊多目標優化、多屬性群體決策求解方法。
本書總結了編者多年來教學與科學的成果,既可作為高等學校有關專業高年級學生和研究生教材,也可為運籌學、管理學、計算機科學、系統科學、信息科學與工程等各行各業,進行生產經營、生產計劃、生產作業管理的高級管理人員和系統分析人員,應用計算機輔助決策提供參考。 前言
第1章線性規劃
1.1基本概念
1.1.1線性規劃問題舉題
1.1.2二維線性規劃的幾何圖解
1.1.3線性規劃的標准形式
1.2單純形法求解
1.3單純形表
1.4人工變數與兩階段法
第2章非線性規劃
2.1非線性規劃問題舉例
2.2基礎知識
2.2.1梯度
2.2.2凸集
2.2.3凸函數
2.3無約束問題的最優解
2.4有等式約束問題的最優解
2.5有不等式約束問題的最優解
2.6無約束問題的近似解法
2.6.1梯度法
2.6.2牛頓法
2.7有約束問題的近似解法
2.7.1罰函數法(外點法)
2.7.2障礙函數法(內點法)
第3章整數規劃
3.1整數規劃問題舉例
3.2分支定界方法
3.3分支定界法求解步驟
第4章決策的基本理論
4.1決策分析基礎
4.1.1隨機情況下決策問題的基本特點
4.1.2不確定情況的決策規劃
4.1.3風險決策的決策——期望貨幣價值規則(EMV)
4.2主觀概率
4.2.1主觀概率的基本概念
4.2.2主觀設定先驗分布的方法
4.2.3利用過去數據設定先驗分布
4.3價值和價值函數
4.3.1結局集上的選好結構
4.3.2確定型問題的價值函數
4.4效用函數
4.4.1貨幣結局的效用
4.4.2價值和效用函數的估值
4.4.3效用函數的型式
4.4.4多屬性價值函數
4.4.5多屬性效用函數
第5章多目標最優化基本概念
5.1多目標最優化問題舉例
5.2多目標優化問題的非劣解
5.2.1劣解與非劣解
5.2.2在決策空間的非劣解
5.3錐的概念
5.4非劣解的幾何意義
5.5弱非劣解的幾何意義
5.6多目標優化問題的求解方法
第6章求解非劣的方法
6.1用加權法求非劣解集
6.1.1P(ω)問題的數值解法
6.1.2非劣解集估計法(NISE法)
6.2用Ρ(ε)約束法求非劣解集
6.2.1Ρ(ε)問題的數值解法
6.2.2Ρ(ε)問題的分析法求解
第7章有總體選好信息的求解方法
7.1選好函數與選好最優解
7.2字典序法
7.3理想點法
7.4目的規劃法
……
第8章基於局部選好信息的互動式方法
第9章多屬性問題求解方法
第10章模糊多目標化問題
第11章多屬性群體決策方法
參考文獻