近幾十年來各國學(xué)者做了很多研究工作,提出了一些思路和方法。但是目前還沒有哪一種方法能夠解決自由書寫的漢字識別問題,已發(fā)表的一些實驗系統(tǒng)的性能也都不夠好,難于付諸實用。因此,在這一章中我們只能擇要分析手寫漢字的特點,討論手寫漢字脫機識別的主要問題和困難,介紹解決問題的途徑、方法以及目前的研究水平;鑒于建立“標(biāo)準(zhǔn)”手寫漢字庫是開展手寫漢字識別研究的基礎(chǔ),因而本章將介紹幾種國內(nèi)外所建立的手寫漢字庫,供讀者參考。我們希望我國能有更多的科技工作者、特別是青年學(xué)者踴躍參加中文信息處理的研究,開拓進取,勇于創(chuàng)新,更好更快地攻克這個堡壘。
4.2 手寫漢字脫機識別的困難
手寫漢字脫機識別跟印刷漢字識別系統(tǒng)同屬光符閱讀器OCR的范疇。它們的識別對象都是二維的方塊漢字,工作原理相同,系統(tǒng)構(gòu)成也基本相似,但手寫漢字脫機識別問題更多,困難更大。
手寫漢字脫機識別為什么那么困難呢?我們認(rèn)為:最根本的