展會信息港展會大全

微軟智能語音多情感技術(shù)升級,曉曉中文語音突破 14 種風(fēng)格
來源:互聯(lián)網(wǎng)   發(fā)布日期:2020-11-07 20:35:34   瀏覽:10085次  

導(dǎo)讀:IT之家11月6日消息 近期,微軟發(fā)布了最新中文曉曉語音升級,中文曉曉新增了 10 種風(fēng)格。升級后的該語音模型風(fēng)格多達(dá) 14 種,處于行業(yè)領(lǐng)先水平。新增風(fēng)格分別是適用于聊天(Chat)場景的語音,還有平靜(Calm)、開心(cheerful)、悲傷(Sad)、憤怒(Angry...

IT之家11月6日消息 近期,微軟發(fā)布了最新中文曉曉語音升級,中文曉曉新增了 10 種風(fēng)格。升級后的該語音模型風(fēng)格多達(dá) 14 種,處于行業(yè)領(lǐng)先水平。新增風(fēng)格分別是適用于聊天(Chat)場景的語音,還有平靜(Calm)、開心(cheerful)、悲傷(Sad)、憤怒(Angry)、 恐懼(Fearful)、 不滿(Disgruntled)、 嚴(yán)厲(Serious)、撒嬌(Affectionate)、溫柔(Gentle)等。此次,微軟升級的多情感技術(shù),極大豐富了聽眾的收聽體驗(yàn),尤其在長文本收聽過程中,可以很大程度緩解聽覺疲勞,提升收聽舒適度。

升級前微軟中文曉曉語音擁有 4 種不同風(fēng)格,分別是新聞(newscast)、客服(customer service)、助理(assistant)、抒情(lyrical),升級后支持多達(dá) 14 種不同風(fēng)格,能在豐富的情緒和場景中自由轉(zhuǎn)換,比如多情感有聲讀物、新聞、客服、助理、聊天等?梢詽M足不同領(lǐng)域客戶的多樣化定制需求。

IT之家了解到,微軟發(fā)布的智能語音合成技術(shù)通過應(yīng)用語音表現(xiàn)力遷移技術(shù),僅利用少量表現(xiàn)力語料數(shù)據(jù),便可以訓(xùn)練出具有高質(zhì)量、高自然度表現(xiàn)力語音生成能力的源模型。該源模型通過對人類語音表現(xiàn)力特征的深入挖掘,獲取了穩(wěn)定性高,適應(yīng)性強(qiáng)的語音情感表征,極大地豐富了合成語音的表現(xiàn)力與可控性,賦予了合成語音擬人的喜怒哀樂,彌補(bǔ)了傳統(tǒng)人工智能語音合成技術(shù)中 “人情味”不足的缺憾。

理想的多情感技術(shù)將是每個聲音都擁有幾十種甚至上百種豐富細(xì)膩的情感表達(dá),可以駕馭不同場景,根據(jù)內(nèi)容表達(dá)自動適配情感。

微軟智能語音多情感技術(shù)發(fā)布,標(biāo)志了語音合成發(fā)展的新趨勢,將成為智能語音應(yīng)用的 “標(biāo)準(zhǔn)配置”,實(shí)現(xiàn)用戶體驗(yàn)新的突破。

試用微軟智能語音多情感技術(shù):https://speech.microsoft.com/audiocontentcreation


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港