1.系統(tǒng)概述
1) OCR專業(yè)版,我公司自主開發(fā)的印刷體文字識別系統(tǒng)識別準確率超過99.5%。
2) OCR SDK二次開發(fā)版,為其它程序使用漢字識別提供了編程的接口。它提供了Windows標準的Dll方式調用,用戶可以通過Dll中的函數(shù)調用SDK中的漢字識別功能,實現(xiàn)系統(tǒng)集成。
2.系統(tǒng)特色
1) 本識別技術的特色是"不采用行掃描,歷遍位圖中的所有點"。采用漢字結構分拆假設法、抽取線條整形法等算法,計算原始點陣的筆畫穿透數(shù)目,從而確定方向線素特征,從漢字筆畫描述庫中檢索出漢字。為提高識別準確性,還采用了周邊四角特征、任意連續(xù)三點特征抽取、輪廓描述等輔助算法來進行檢驗。
2) 使用流線式掃描并識別,掃描識別一鍵OK。
3.運行環(huán)境
運行環(huán)境 Windows 9x/Me/NT/2000/XP
最低配置 CPU 300 MHZ以上,64M內存以上(建議128M以上)
4.技術、質量參數(shù)
識別速度:在PIII 1.2G處理器256M內存的PC機上,2至8秒/A4頁。
識別字體:全自動識別宋、仿宋、楷、黑、圓、隸書等百余種中文簡體,英文、數(shù)字、圖片混排的稿件。
識別語言:簡體中文
單字識別準確率:印刷體漢字≥99%
聯(lián)想識別準確率:印刷體漢字≥99.5%
支持文件格式:BMP、TIF、TIFF、JPG、JPEG、PCX、TGA、DIB、EMF、WMF。
輸出格式:TXT、RTF。
識別要求:對普通書本的印刷質量,5號字體以上的印刷材料,可選擇掃描分辨率為300dpi以上,字體越小要求分辨率越高。
其它功能:自動傾斜更正、去除指定顏色、保留指定顏色、灰度處理等。
支持硬件:普通掃描儀、名片掃描儀、逐行掃描筆、數(shù)碼相機、帶數(shù)碼相機功能的手機等。
5.技術應用:
1) 辦公自動化中漢字文件資料自動輸入,漢字圖像文本的壓縮存儲、傳輸。
2) 書刊自動閱讀器,盲人閱讀器。
3) 數(shù)字圖書館的建設,檔案資料數(shù)字化,建立漢字文獻檔案庫。報刊﹑雜志﹑書籍等黑白彩色印刷品的數(shù)字化及電子出版,書刊、資料的再版輸入。
4) 車牌辨識系統(tǒng)。分別應用于:交警對超速和闖紅燈的車牌識別、高速公路收費。
5) 身份證識別,這是一種采用高效識別算法將身份證各部分進行識別且將識別結果按特定應用進行管理的系統(tǒng),可用于行政單位、工廠企業(yè)、銀行等,如:考勤管理(代替考勤卡)、身份快速確認(門禁系統(tǒng))、銀行等單位的身份證號碼快速錄入。
6) 郵政編碼識別與分揀。在這之前,由于手寫文字識別率不高,因此郵政編碼識別與分揀還沒有得到廣泛的應用。
7) 智能全文信息管理系統(tǒng)、多媒體應用系統(tǒng)、自動翻譯系統(tǒng)。