車牌識別系統(tǒng)是智能交通的重要組成部分,它采用先進(jìn)的圖像處理、模式識別和人工智能技術(shù),通過對圖像數(shù)據(jù)的采集和分析,獲取有用的車牌信息,從而達(dá)到高智能化交通管理。
神經(jīng)網(wǎng)絡(luò)技術(shù)作為人工智能的主要技術(shù)之一,在車牌識別領(lǐng)域已得到了很好的應(yīng)用,但這種應(yīng)用一般只局限于字符識別領(lǐng)域的通用化方案,而在面對眾多人為或非人為因素造成的車牌污損、部分遮擋等情況,如仍采用通用化的識別方案常常會顯得力不從心。
對污損車牌識別,人們曾做過不少嘗試。譬如,基于點(diǎn)陣的思路,但其也存在局限性,并且對誤差的剔除不夠徹底;而神經(jīng)網(wǎng)絡(luò)方法雖有一定成效,但對人為的污損和遮擋,因其采用“模糊性”識別而很容易被“蒙騙”,比如:字符“T”被貼住右上部后會被誤識別為“7”。另外,基于核算法的識別技術(shù),原理上是可以解決不同情況下車牌識別的結(jié)果分離問題,但由于車牌污損情況的多樣性、人為性和隨機(jī)性,要找到合適的核函數(shù)將非常困難。
圖1-1 污損的字符 圖1-2 標(biāo)準(zhǔn)字符
本文將介紹參考人類識別污損車牌的推理邏輯,提出了一個全新的進(jìn)行局部相似度誤差過濾的方案,以便能較好地解決字符信息不完整的識別問題。
局部相似度誤差過濾的原理及其運(yùn)算
局部相似度誤差過濾是基于人類對部分信息缺失的字符識別的推理邏輯和對于實(shí)驗(yàn)數(shù)據(jù)中的粗大誤差處理的思想相融合而來的。人們在識別字符信息的時候,即便是遮擋了大部分經(jīng)常也可以根據(jù)表現(xiàn)出來的局部特征進(jìn)行推理而得到正確的答案,其基于的邏輯就是“具備此顯而易見特征的可能是什么字符”,其本質(zhì)上是在局部相似度判斷上屬于模板匹配中的判定未知模式與哪個參考模式是最佳匹配的問題,算法上采用了由神經(jīng)網(wǎng)絡(luò)完成模式匹配,在整個字符的識別上屬于聚類方法中的混合值向量的相似性問題 ,即基于區(qū)域識別的相似性計(jì)算結(jié)果。
局部相似度
在運(yùn)算上,相似度的問題可以先用神經(jīng)網(wǎng)絡(luò)對識別的局部進(jìn)行識別,然后用識別結(jié)果對應(yīng)的標(biāo)準(zhǔn)模板與待識別樣本再進(jìn)行一次距離計(jì)算(這里采用歐氏距離),參見下面算式(式1):
(式1)
不同的字符應(yīng)采取不同的局部分類方式,如數(shù)字“1”可以僅僅采用左、中、右三部分,只要中部(圖1-1中2、5、8區(qū)域)有良好的相似度就可以確定為“1”。
但為提高準(zhǔn)確度,比較復(fù)雜的字符,比如數(shù)字“9”,就需要上、中、下與左、中、右共6部分(允許區(qū)域劃分上重疊)。對于特別復(fù)雜的,比如漢字“豫”,就需要用如圖1-1中1?9九個區(qū)域單獨(dú)進(jìn)行計(jì)算。對于區(qū)域劃分重疊了的,其誤差(污損)的影響也將是多次的,因此在去除粗大誤差環(huán)節(jié)也允許多次去除。[nextpage]
誤差濾除和結(jié)果判定
按聚類方法中的混合值向量的相似性問題的方法,每個區(qū)域的結(jié)果經(jīng)規(guī)格化處理后作為待識別字符的一維(區(qū)間尺度0?1),所有區(qū)域的值序列構(gòu)成了待識別字符的值向量x i,參考模式的值向量x j為各元素都為1的向量,按混合值向量的相似性函數(shù)的定義,如下函數(shù)式(式2):
(式2)
式2中sq(x i , x j)是x i和x j的第q個坐標(biāo)的相似度,且wq是對應(yīng)于第q個坐標(biāo)的加權(quán)系數(shù),這里的wq=1, 且(如式3):
(式3)
sq接近0的認(rèn)為其為嚴(yán)重不符合區(qū)域或者污損區(qū)域,為了剔除污損區(qū)域?qū)ο嗨菩杂?jì)算的影響,允許人為地將sq最小的一到兩個坐標(biāo)點(diǎn)的wq置為0,即該點(diǎn)不參與總體相似性的計(jì)算,以此濾除粗大誤差。
實(shí)際工程應(yīng)用中,這部分的判斷可用二值化的結(jié)果來進(jìn)行,也就是對應(yīng)某一區(qū)域的相似性,僅僅根據(jù)式2-1的結(jié)果分為“相似”與“不相似”,因?yàn)樵谛蛄信卸A段,并不關(guān)注各個區(qū)域的相似性的大小,而是關(guān)注各個區(qū)域相似性序列的總體符合程度。
局部相似度誤差過濾的優(yōu)缺點(diǎn)及工程應(yīng)用方法
從以上介紹可看出,該方法在原理上屬于模板匹配,但同時也引入了神經(jīng)網(wǎng)絡(luò)識別技術(shù)和聚類分析中的理論,以及實(shí)驗(yàn)誤差分析領(lǐng)域的粗大誤差處理的方法。神經(jīng)網(wǎng)絡(luò)的引入目的是快速確定某一個區(qū)域的特征的大概符合性,減少逐個模板比對的時間;聚類中混合值向量相似性分析的引入是為了便于對區(qū)域相似性序列進(jìn)行總體相似性計(jì)算;粗大誤差的引入是為了消除污損區(qū)域?qū)Y(jié)果的影響(對污損區(qū)域,神經(jīng)網(wǎng)絡(luò)的計(jì)算往往是錯誤的結(jié)果)。
和其他模板匹配方法一樣,本方法也同樣存在一定缺陷,其計(jì)算量較大,特別是在實(shí)時視頻流的快速單幀識別的時候,識別速度將是關(guān)鍵因素。為此,工程上必須進(jìn)行特殊的處理才能滿足實(shí)際的需要,除了前述的相似度的二值化處理外,考慮到大多數(shù)車牌都是非污損的車牌,工程上只有在正常識別得不到滿意的結(jié)果,即相似度達(dá)不到標(biāo)準(zhǔn)時,才進(jìn)行更進(jìn)一步的局部相似度誤差過濾處理,并且在此處理過程中,根據(jù)實(shí)際計(jì)算的硬件環(huán)境,往往可以采取犧牲后續(xù)幀的方式來進(jìn)行識別(因?yàn)楣こ虘?yīng)用中,相鄰幀間變化并不大)。
具體到停車場和高速公路收費(fèi)的應(yīng)用中,往往是對車輛壓地感監(jiān)測線圈的瞬間抓拍的照片進(jìn)行識別,一般會對每個車輛抓拍1?2張圖片,這樣一來,識別時間就比較充裕,以目前計(jì)算機(jī)的運(yùn)算能力,可以保證在允許的時間段內(nèi)完成足夠復(fù)雜的識別算法。
應(yīng)用前景展望
該技術(shù)除了在車牌識別領(lǐng)域可以很好地使用外,其思想還可以延伸到車型識別,甚至車輛無人駕駛領(lǐng)域的動態(tài)物體識別和目標(biāo)鎖定上。此外,在其他傳感器的信息配合下,還可以組建多傳感器的綜合識別和目標(biāo)跟蹤、鎖定和控制系統(tǒng)。但對于這些復(fù)雜的應(yīng)用,由于計(jì)算節(jié)點(diǎn)的增多和實(shí)時性的要求,必然需要分布式的跨系統(tǒng)的綜合性的解決方案。