劃重點(diǎn)
01OpenAI全面發(fā)布類人ChatGPT語(yǔ)音助手,支持50種語(yǔ)言說(shuō)“對(duì)不起”。
02新功能將在未來(lái)幾天內(nèi)逐步推出,首先在美國(guó)市場(chǎng)上線,下周將向OpenAI Edu和Enterprise計(jì)劃的訂閱者開放。
03用戶可以利用自定義指令和記憶功能確保語(yǔ)音模式的個(gè)性化,讓AI助手根據(jù)用戶對(duì)所有對(duì)話的偏好做出響應(yīng)。
04此外,OpenAI本周二推出了五種不同風(fēng)格的新聲音,可選聲音達(dá)到九種。
05由于此,OpenAI提高了部分外語(yǔ)的對(duì)話速度、流暢度和口音。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
本文作者:李丹
來(lái)源:硬AI
OpenAI首次公開發(fā)布四個(gè)月后,ChatGPT的類人高級(jí)人工智能(AI)語(yǔ)音助手功能終于開始面向廣大付費(fèi)用戶。
美東時(shí)間9月24日周二,OpenAI宣布,所有付費(fèi)訂閱OpenAI ChatGPT Plus 和 Team 計(jì)劃的用戶都將可以使用新的 ChatGPT 高級(jí)語(yǔ)音模式Advanced Voice,該功能將在未來(lái)幾天內(nèi)逐步推出,將首先在美國(guó)市場(chǎng)上線。下周,該功能將向OpenAI Edu 和 Enterprise 計(jì)劃的訂閱者開放。
ChatGPT「Her」全量開放!新增記憶、自定義指令,50種語(yǔ)言暢聊
這意味著,本周,ChatGPT的Plus 版?zhèn)人用戶和 Teams 版小型企業(yè)團(tuán)隊(duì)用戶都可以啟用新的語(yǔ)音功能,只需通過說(shuō)話、無(wú)需手動(dòng)輸入提示詞和GPT對(duì)話。在App上訪問高級(jí)語(yǔ)音模式時(shí),用戶可以通過彈出窗口知道自己已經(jīng)進(jìn)入了高級(jí)語(yǔ)音助手,用戶會(huì)收到App的通知。
OpenAI賦予ChatGPT新語(yǔ)音版兩種功能,一是為語(yǔ)音助手存儲(chǔ)“自定義指令”的功能,二是記住用戶希望語(yǔ)音助手表現(xiàn)何種行為的“記憶”功能,類似于今年4月OpenAI為ChatGPT 文本版本推出的記憶功能。用戶可以利用這些功能確保語(yǔ)音模式的個(gè)性化,讓AI助手根據(jù)用戶對(duì)所有對(duì)話的偏好做出響應(yīng)。
OpenAI本周二推出了五種不同風(fēng)格的新聲音,分別名為Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版語(yǔ)音模式推出的四種聲音 Breeze、Juniper、Cove 和 Ember,可選聲音達(dá)到九種。OpenAI還提高了部分外語(yǔ)的對(duì)話速度、流暢度和口音。
OpenAI介紹,先進(jìn)的語(yǔ)音助手可以用50種語(yǔ)言說(shuō)“對(duì)不起,我遲到了”,并在社交媒體的發(fā)帖中附上一段視頻,演示用戶可以要求語(yǔ)音助手表達(dá),因?yàn)樽屇棠痰攘撕芫,向奶奶致歉。視頻顯示,AI助手首先按照要求總結(jié)了用戶想要表達(dá)的意思,用英語(yǔ)說(shuō)了一遍,而后,在用戶提示AI奶奶只會(huì)說(shuō)普通話之后,AI助手又用標(biāo)準(zhǔn)的普通話說(shuō)了一遍。
全新的語(yǔ)音功能適用于OpenAI的AI模型GPT-4o,不適用于最近發(fā)布的預(yù)覽模型 o1。
此次新語(yǔ)音功能上線可謂姍姍來(lái)遲。華爾街見聞曾提到,今年5月OpenAI就在推出新旗艦?zāi)P虶PT-4o時(shí)演示了語(yǔ)音模式Voice Mode。當(dāng)時(shí)GPT-4o支持的ChatGPT聲音聽起來(lái)像一名美國(guó)成年女性,可以即時(shí)回應(yīng)請(qǐng)求。當(dāng)它聽到演示的OpenAI 研究主管 Mark Chen呼氣過度時(shí),似乎從中察覺到了他的緊張,然后說(shuō)他說(shuō)“Mark,你不是吸塵器”,告訴Chen要放松呼吸。
OpenAI原計(jì)劃6月末向一小批Plus計(jì)劃用戶推出該語(yǔ)音模式,但6月宣布推遲一個(gè)月發(fā)布,以便確保該功能安全有效地處理來(lái)自數(shù)百萬(wàn)用戶的請(qǐng)求。當(dāng)時(shí)OpenAI稱,計(jì)劃今年秋季讓所有Plus用戶都可以訪問該功能,確切的時(shí)間表取決于是否達(dá)到內(nèi)部對(duì)安全性和可靠性的高標(biāo)準(zhǔn)。
7月末,OpenAI對(duì)有限的部分付費(fèi)Plus用戶推出高級(jí)語(yǔ)音模式下的ChatGPT,稱語(yǔ)音模式無(wú)法模仿他人的說(shuō)話方式,且增加了新的過濾器,保證軟件能夠發(fā)現(xiàn)并拒絕某些生成音樂或其他形式受版權(quán)保護(hù)音頻的請(qǐng)求。不過,新的語(yǔ)音模式缺少5月OpenAI展示過的不少功能,比如計(jì)算機(jī)視覺功能。該功能可讓GPT僅通過使用智能手機(jī)的攝像頭就對(duì)用戶的舞蹈動(dòng)作提供語(yǔ)音反潰