語音識別裝置以及語音識別方法
申請專利號 CN03157364.9
專利申請日 2003.09.18
名稱 語音識別裝置以及語音識別方法
公開(公告)號 CN1492394
公開(公告)日 2004.04.28
類別 物理
頒證日
優(yōu)先權(quán) 2002.9.18 JP 271670/2002
申請(專利權(quán)) 日本先鋒公司
地址 日本東京
發(fā)明(設(shè)計)人 外山聰一
國際申請
國際公布
進入國家日期
專利代理機構(gòu) 北京三友知識產(chǎn)權(quán)代理有限公司
代理人 李輝
摘要
本發(fā)明的語音識別裝置和語音識別方法目的在于減低雜音適應處理和發(fā)話者適應處理時的處理量。事先記憶代表語音模型C和差分模型D。實行語音識別前,對代表語音模型C施行雜音適應處理以生成雜音適應代表語音模型C
主權(quán)項
1.一種語音識別裝置,其將實施了雜音適應處理和發(fā)話者適應處理 的合成語音模型與自發(fā)話時的發(fā)話語音求得的特征矢量系列進行對照來 實行語音識別,其特征在于包括: 記憶手段,其通過小組化或群集化且根據(jù)類似性把多數(shù)的語音模型 分類成若干小組,且能夠預先記憶自通過小組化或群集化而屬于同一小 組的每個小組的語音模型代表性地求得的各小組的代表語音模型、通過 按上述各同一小組來求得屬于上述各組的語音模型與上述代表語音模型 之間的差分而得到的且屬于各小組的差分模型、使上述代表語音模型和 差分模型對應于各同一小組的小組信息; 雜音適應代表語音模型生成手段,其通過對記憶在上述記憶手段中 的每個同一小組的代表語音模型實行雜音適應處理來生成雜音適應代表 語音模型; 合成語音模型生成手段,其根據(jù)上述小組信息按上述每個同一小組 把屬于上述各小組的上述差分模型與上述雜音適應代表語音模型進行合 成,從而生成每個同一小組的合成語音模型; 更新模型生成手段,其對于實施過上述雜音適應處理的上述每個同 一小組的合成語音模型,根據(jù)自發(fā)話語音求得的特征矢量系列施行發(fā)話 者適應處理,從而生成雜音發(fā)話者適應語音模型; 模型更新手段,從上述雜音發(fā)話者適應語音模型與根據(jù)上述小組信 息選擇的上述雜音發(fā)話者適應語音模型所屬的小組的上述雜音適應代表 語音模型之間的差分來生成上述每個同一小組的更新差分模型,同時按 照該生成的更新差分模型來更新上述記憶手段中記憶的每個同一小組的 差分模型; 在語音識別時,通過對根據(jù)上述小組信息選擇的上述更新差分模型 所屬的小組的上述代表語音模型實施雜音適應處理來生成雜音適應代表 語音模型,同時將雜音適應代表語音模型與上述更新的更新差分模型進 行合成來生成實施過雜音適應處理和發(fā)話者適應處理的合成語音模型, 并且通過把該合成語音模型與自要被識別的發(fā)話者語音求得的特征矢量 系列進行對照來實行上述語音識別。