1 引言
運(yùn)動(dòng)目標(biāo)檢測是數(shù)字圖像處理技術(shù)的一個(gè)重要部分,是各種后續(xù)高級(jí)處理任務(wù)如目標(biāo)識(shí)別與跟蹤、目標(biāo)分類、行為理解和分析等的基礎(chǔ)。運(yùn)動(dòng)目標(biāo)檢測是指從連續(xù)的視頻序列中實(shí)時(shí)地將前景目標(biāo)(運(yùn)動(dòng)對(duì)象)所在的區(qū)域從背景(自然場景)中分割提取出來,即完成前景和背景的分離。對(duì)于這一工作現(xiàn)有的實(shí)現(xiàn)方法一般有四種:光流計(jì)算法[2]、相鄰幀間運(yùn)動(dòng)分析法[3]、運(yùn)動(dòng)能量檢測法[4]和背景消減法[5]。光流計(jì)算法的優(yōu)點(diǎn)是能夠檢測獨(dú)立運(yùn)動(dòng)的對(duì)象,不需要預(yù)先知道場景的任何信息,并且可用于攝像機(jī)運(yùn)動(dòng)的情況,但多數(shù)光流法的計(jì)算復(fù)雜耗時(shí),除非有特殊的硬件支持,并且很難符合實(shí)時(shí)處理的要求;幀間運(yùn)動(dòng)分析法對(duì)動(dòng)態(tài)環(huán)境的適應(yīng)能力比較強(qiáng),但不能夠完整地分割運(yùn)動(dòng)對(duì)象,不利于進(jìn)一步的對(duì)象分析與識(shí)別;運(yùn)動(dòng)能量檢測法適合于復(fù)雜變化的環(huán)境,能消除背景中振動(dòng)的像素,使按某一方向運(yùn)動(dòng)的對(duì)象更加突出地顯現(xiàn)出來,但難以獲得目標(biāo)所在區(qū)域的精確描述;背景消減法適用于攝像機(jī)靜止的情形,它為靜止背景建立背景模型,通過將當(dāng)前圖像幀和背景模型進(jìn)行比較,確定出亮度變化較大的區(qū)域,即認(rèn)為是前景區(qū)域,這種方法實(shí)現(xiàn)簡單,計(jì)算速度快,能夠?qū)崟r(shí)地處理連續(xù)的圖像序列,并可以獲得關(guān)于運(yùn)動(dòng)目標(biāo)區(qū)域的完整精確的描述。
背景消減法主要涉及到對(duì)于背景如何建模的問題,同時(shí)由于環(huán)境的變化如場景中光照條件引起的亮度改變、物體的運(yùn)動(dòng)引起的背景遮擋等,背景并不是靜止不變的,在實(shí)際應(yīng)用中如果直接用輸入圖像與背景圖像差分進(jìn)行分割,則會(huì)產(chǎn)生不理想甚至是錯(cuò)誤的分割,需要采用一定的算法進(jìn)行背景模型的動(dòng)態(tài)更新。目前許多研究人員都致力于好的背景模型研究,以期減少動(dòng)態(tài)場景對(duì)于準(zhǔn)確分割的影響。本文針對(duì)帶有運(yùn)動(dòng)目標(biāo)的復(fù)雜背景采用一種簡單的自適應(yīng)算法, 使背景模型每隔一定的時(shí)間間隔自動(dòng)更新一次, 從而使對(duì)象分割達(dá)到比較理想的效果。
2 自適應(yīng)背景建模算法
背景圖像的獲取及自動(dòng)更新是實(shí)現(xiàn)穩(wěn)定、準(zhǔn)確的運(yùn)動(dòng)目標(biāo)檢測的重要步驟。對(duì)于一個(gè)固定的場景,在沒有運(yùn)動(dòng)對(duì)象出現(xiàn)、沒有光照變化等的情況下,考慮到視頻采樣過程中噪聲的影響,場景中各像素點(diǎn)的亮度值或灰度值符合一個(gè)隨機(jī)概率分布,以某一均值為基線,在其附近作不超過某一偏差的隨機(jī)振蕩, 這種情況下的場景稱之為背景。而實(shí)際的場景環(huán)境往往是動(dòng)態(tài)變化的。如室內(nèi)場景的動(dòng)態(tài)變化,主要體現(xiàn)在燈光的突然熄滅、點(diǎn)亮,運(yùn)動(dòng)對(duì)象的出現(xiàn)、運(yùn)動(dòng)和消失等,此時(shí)攝像頭捕獲的場景測量值中,還包含了光照的改變、前景對(duì)象等環(huán)境的動(dòng)態(tài)變化對(duì)背景各像素點(diǎn)亮度值的影響。背景獲取的最終目的是把運(yùn)動(dòng)對(duì)象從背景中分割出來,主要就是通過連續(xù)的視頻幀找出屬于背景的像素點(diǎn),同時(shí)把光照的改變檢測出來并融合到背景中,實(shí)現(xiàn)背景的自適應(yīng)更新。
2.1 傳統(tǒng)的背景建模方法
目前常用的背景抽取方法往往是將背景的構(gòu)建與背景的更新視為兩個(gè)獨(dú)立的階段,首先利用統(tǒng)計(jì)的方法構(gòu)建出背景圖像,然后隨著場景的動(dòng)態(tài)變化不斷地對(duì)它作適當(dāng)?shù)母隆_@些方法在背景構(gòu)建階段一般需要一段不含有前景運(yùn)動(dòng)目標(biāo)的監(jiān)控場景的圖像序列,在實(shí)際應(yīng)用中可能很難得到這樣的圖像序列,例如在高速公路上獲取的視頻圖像序列中,想要獲取無運(yùn)動(dòng)目標(biāo)的背景幀幾乎是不可能的。在背景更新階段大多通過構(gòu)造復(fù)雜的模型來解決場景變化的問題,其計(jì)算量大,而且有時(shí)可能無法滿足實(shí)時(shí)處理的要求。
2.2 自適應(yīng)背景建模方法
本文提出的自適應(yīng)背景建模方法將背景的構(gòu)建與更新結(jié)合于一體,可以在場景中存在運(yùn)動(dòng)對(duì)象的情況下提取出最新的背景圖像。在一個(gè)固定的場景中,背景像素被遮擋時(shí)它的亮度值會(huì)出現(xiàn)一個(gè)明顯的變化,由于作為背景的每個(gè)像素被遮擋的時(shí)間與它暴露的時(shí)間相比是非常短暫的,可以把運(yùn)動(dòng)目標(biāo)看作是一個(gè)對(duì)背景圖像的隨機(jī)擾動(dòng),從而可以利用一段連續(xù)的圖像序列來消除運(yùn)動(dòng)目標(biāo)的影響。算法流程如圖1所示。
圖1 算法流程圖
最初可以將攝像機(jī)捕獲到的首張視頻圖像作為初始背景,然后采用如下算法實(shí)現(xiàn)背景圖像的自適應(yīng)抽取。其間,輸入視頻圖像序列并不需要將每一幀都用來對(duì)背景模型進(jìn)行更新,因此對(duì)視頻序列進(jìn)行W抽樣,即每W幀間隔抽取一幀對(duì)背景模型進(jìn)行更新,即W為抽樣速率。令V(i,j)為每間隔W幀抽取一幀的連續(xù)T幀采樣得到的圖像在位置(i,j)的灰度值向量組,即
V(i,j) ={Vt(i,j)|t =1,...,T} (1)
其中,Vt(i,j)為第t幀圖像在位置(i,j)的灰度值。折衷考慮所需參與計(jì)算的視頻序列的長度和背景提取的效率,可以由實(shí)驗(yàn)或經(jīng)驗(yàn)確定W的值。
令B為最終得到的背景模型的數(shù)學(xué)表示,而Y(i,j)為背景模型B在位置(i,j)的灰度值。對(duì)于所有的(i,j)采用如下公式所述的算法對(duì)V(i,j) 執(zhí)行中值濾波可以得到Y(jié)(i,j),
(2)
從而實(shí)現(xiàn)背景的更新,得到當(dāng)前時(shí)刻的背景圖像
B={Y(i,j)|i=1,...,Nandj=1,...,M} (3)
其中,N、M分別是視頻圖像的高和寬。
盡管在背景建模初期所得到的背景圖像可能并不精確,但是隨著場景中對(duì)象的運(yùn)動(dòng),后續(xù)差異圖像中新的背景信息會(huì)使背景圖像變得越來越完整,而且當(dāng)場景中發(fā)生光照改變等動(dòng)態(tài)變化對(duì)已恢復(fù)的背景圖像產(chǎn)生影響時(shí),這種背景建模方法可同時(shí)對(duì)背景圖像進(jìn)行及時(shí)地更新,以反映背景在實(shí)際中的漸變。
3 實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證本文的自適應(yīng)背景建模算法的有效性,筆者在實(shí)驗(yàn)室中設(shè)置了一個(gè)單攝像頭的簡單的視頻監(jiān)控環(huán)境,不斷地使人的運(yùn)動(dòng)出現(xiàn)在攝像頭視野內(nèi),應(yīng)用該算法。同時(shí),由于在實(shí)驗(yàn)室中采集到的圖像的背景比較簡單,筆者也將該算法應(yīng)用到了正在開發(fā)研究的實(shí)際水下監(jiān)控系統(tǒng)中進(jìn)行了測試。下面給出的是筆者對(duì)以每秒25幀的速率采樣到的(352×288)格式的視頻序列應(yīng)用該算法的實(shí)驗(yàn)結(jié)果。圖2和圖3中的(a)是每0.5秒間隔抽取一幀的十幀連續(xù)的視頻圖像,而(b)是計(jì)算出的背景圖像。
其中,對(duì)抽樣速率W和抽樣視頻序列的長度T的選取是否合適都會(huì)影響實(shí)驗(yàn)結(jié)果。當(dāng)T一定時(shí),如果W過小使得抽樣速率遠(yuǎn)遠(yuǎn)小于目標(biāo)運(yùn)動(dòng)速率時(shí),可能會(huì)將運(yùn)動(dòng)目標(biāo)誤判斷為是靜止的場景信息而得不到精確的背景模型;如果W過大可能會(huì)使程序執(zhí)行時(shí)間過長,從而難以滿足實(shí)時(shí)處理的要求。當(dāng)W一定時(shí),如果T過小即樣本值過少,會(huì)影響背景的恢復(fù)效果,失去本算法對(duì)背景更新的意義;如果T過大可能會(huì)影響實(shí)時(shí)處理的效果。因此在實(shí)際中應(yīng)該針對(duì)具體環(huán)境通過實(shí)驗(yàn)或者經(jīng)驗(yàn)確定W和T的值。我們針對(duì)具體環(huán)境進(jìn)行了大量實(shí)驗(yàn),得出當(dāng)W為12、T為10,即對(duì)每0.5秒間隔抽取一幀的十幀輸入圖像進(jìn)行處理的效果比較理想。
(a)連續(xù)的十幀視頻圖像 (b)背景圖像
圖2 對(duì)實(shí)驗(yàn)室中監(jiān)控系統(tǒng)的測試結(jié)果
(a)連續(xù)的十幀視頻圖像 (b)背景圖像
圖3 對(duì)實(shí)際的水下監(jiān)控系統(tǒng)的測試結(jié)果
實(shí)驗(yàn)的結(jié)果驗(yàn)證了本算法實(shí)現(xiàn)自適應(yīng)背景建模的可行性和有效性,無論是在簡單的環(huán)境還是比較復(fù)雜的場景中,對(duì)背景的抽取結(jié)果都比較令人滿意。而且該算法實(shí)現(xiàn)簡單,只需使用較少的圖像幀數(shù)就能獲得完整的背景圖像,并且能夠滿足實(shí)時(shí)性的要求。
4 結(jié)語
本文采用的自適應(yīng)背景建模算法,能夠自動(dòng)地將前景中存在運(yùn)動(dòng)目標(biāo)的復(fù)雜背景較準(zhǔn)確的提取出來,算法結(jié)構(gòu)簡單,可以在短時(shí)間內(nèi)較完整地構(gòu)建出背景圖像,并且能夠適應(yīng)光線的變化及時(shí)地更新背景。將該算法應(yīng)用于視頻監(jiān)控系統(tǒng)中運(yùn)動(dòng)目標(biāo)的檢測簡捷、有效、便于實(shí)現(xiàn),并且符合實(shí)時(shí)處理的要求。
參考文獻(xiàn):
[1] How-Lung Eng, Kar-Ann Toh, JunxianWang and Wei-Yun Yau. An automatic drowning detection surveillance system for challenging outdoor pool environments [C]. In: Proceedings of the Ninth IEEE International Conference on Computer Vision (ICCV 2003).
[2] Barron J, Fleet D, Beauchemin S. Performance of optical flow techniques [J]. International Journal of Computer Vision, 1994:12(1): 42~77.
[3] Lipton A, Fujiyoshi H, Patil R. Moving target classification and tracking from real-time video[C]. In: Proc of WACV?8, 1998:8~14.
[4] Richard P Wildes. A measure of motion salience for surveillance applications [C]. In: Proc of Image Processing, 1998:102~121.
[5] Stauffer C and Grimson W. Adaptive background mixture models for real-time tracking [C]. Computer Vision and Pattern Recognition, CV PR?9, Fort Colins, CO,June 1999.
[6] Stefan Huwer. Adaptive Change Detection for real-time Surveillance Applications [J]. 2000 IEEE.