劃重點
01OpenAI推出高級語音模式,首批體驗僅限部分Plus和Team用戶,本周內(nèi)向所有用戶推送。
02網(wǎng)友們嘗試讓ChatGPT模仿不同情緒、語氣和聲音,展示出豐富的語音表現(xiàn)能力。
03除此之外,ChatGPT高級語音模式還可用于講故事、配音效、外語教學(xué)等實用場景。
04然而,目前高級語音模式仍存在限制,如時長限制、屏幕共享功能缺失等。
05OpenAI總裁Greg Brockman表示,實現(xiàn)流暢的語音對話將讓我們意識到在計算機中輸入內(nèi)容是多么不自然。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
千呼萬喚始出來,ChatGPT 的高級語音模式終于上線,本周內(nèi)向所有 Plus 和 Team 用戶全量推送。然而,「本周內(nèi)」也是猶抱琵琶半遮面的泛指,仍然是一部分人先用起來。如果你也還沒被推送到,不妨在等待之余,看看幸運網(wǎng)友們是怎么整活和刁難 AI 的。喘氣、哭泣、表演口技,你看 ChatGPT 有幾分像人角色扮演,往往是考驗語音 AI 的第一課。讓 ChatGPT 用聲音表演不同情緒,興奮的、平靜的、戲精的,它都信手捏來,情緒飽滿且自然,不知道哪里進修的表演班。情緒激動時甚至有點過頭,對話者連說好幾個 OK,才把它的表演欲給摁祝
視頻來自:X@WorldEverett
除了說話的語氣,我們的笑、哭、喘氣等狀態(tài),也體現(xiàn)了文字不能道盡的心情。如果 AI 能夠完美地復(fù)刻,那就更加擬人了。這難不倒 ChatGPT,它邊傷心啜泣,邊贊美自己的語音模式有多厲害,沖擊力堪比短視頻的 AI 紫薇,好像隨時都能過呼吸。
視頻來自:X@DavidTaylor_MD當 ChatGPT 代入一位奪得金牌的運動員,模仿同樣惟妙惟肖,說話大喘氣,表現(xiàn)出既興奮又疲憊的精神狀態(tài)。
視頻來自:X@wongmjane讓 ChatGPT 嘗試 Vtuber(虛擬主播)賽道,也不是不可以,不過這個聲音有點尖細,不夠自然,建議聽洛天依和初音未來洗洗耳朵。
視頻來自:X@wongmjane京中有擅口技者,僅一桌、一椅、一扇、一撫尺,ChatGPT 模仿各種聲音的能力不比人類藝術(shù)家,倒也馬馬虎虎。
視頻來自:YouTube@MattVidPro AI你要求邊講故事邊配音效,AI 就能現(xiàn)演開門的吱嘎聲、蟲子的嘰喳聲,盡管功力還不夠純熟。把思路打開,高級語音模式很適合給孩子們講睡前故事,故事內(nèi)容、旁白、音效一手包辦,一個 AI 就是一個團隊。自娛自樂之余,實用主義者們已經(jīng)開始拿 ChatGPT 干活,做些有價值的事情了。ChatGPT 會說 50 多種語言,懂各種腔調(diào)的英語,很多小語種,甚至方言。所以也就很容易想到,讓 AI 當外語老師,切換語言和我們對話。據(jù)說英語母語人士最難學(xué)的語言之一馬耳他語,也不在話下。
視頻來自:X@anthonyspiteri巧的是,語言學(xué)習(xí)軟件多鄰國,也在周二的年度大會 Duocon 推出了 AI 視頻通話,用戶可以和多鄰國角色「拽姐」練習(xí)口語。不過,目前只適用于英語、西班牙語和法語。
看來,教培行業(yè)假設(shè)了,有了 AI 之后,我們不是不用學(xué)外語,而是更隨時隨地學(xué)各種各樣的外語。AI 不僅可以當外語老師,X 網(wǎng)友 @Lyle_AI 通過 ChatGPT 高級語音模式,改進自己的銷售話術(shù),整個操作流程非常值得借鑒。
他讓 AI 扮演一名銷售專家,然后向 AI 推銷,讓 AI 反饋自己的話術(shù)說服力強不強、夠不夠清晰,以及有沒有價值。AI 反饋之后,他還會追問,并讓 AI 給出示范。練習(xí)、反愧提問、模仿,推而廣之,這套流程可以用到面試、演講等場景,讓 AI 幫社恐的人類更擅長口語表達。AI 能說,但能不能聽?一位網(wǎng)友另辟蹊徑,讓 ChatGPT 給吉他調(diào)音。
視頻來自:x@skirano他邊彈邊問行不行,隨時打斷 AI,ChatGPT 表現(xiàn)得很內(nèi)行,但不知道它的耳朵有沒有調(diào)音器準。總之,決定 AI 發(fā)揮的上限大概有兩方面。一個是模型的能力,低延遲和隨時打斷讓對話有來有往,不考驗用戶的耐心。另一個是網(wǎng)友的想象力,讓語音場景有無限的可能性。姍姍來遲的高級語音,還不能做你的日常搭子滿打滿算,從發(fā)布 Demo 到正式推送,已經(jīng)過去了 4 個月,OpenAI 高級語音模式仍然未能完美,和發(fā)布會時相比也打了個折扣。時長限制是最讓話癆的人類遺憾的,暫時別想和 AI 深夜煲電話粥了,CNBC 和 X 網(wǎng)友 @MattVidPro 的體驗都發(fā)現(xiàn),只能和 ChatGPT 聊 45 分鐘左右。OpenAI 的官方回答是,每天的限制時間可能都不一樣,當天還剩 15 分鐘時,會進行提醒。視頻和屏幕共享功能也沒能實現(xiàn),AI 沒有「眼睛」,意味著不能像 Demo 那樣,讓它實時解題、給代碼糾錯,或者夸夸我們的寵物。
另外就是一些細節(jié)上面的問題了,OpenAI 的官方例子里,在模擬因為遲到給奶奶道歉的場景時,ChatGPT 的普通話語氣很真誠,但仍然有些譯制腔,不如國產(chǎn) AI。并且,它給出的話術(shù)也比較僵硬,誰會對自己的奶奶說,「我可以怎么補償您呢」。以上種種說明 AI 還沒能修成人形,同時,OpenAI 也給它增加了一些額外的禁制。YouTuber 博主@MattVidPro AI 在直播體驗時,意外踩到了 OpenAI 的雷。他讓 ChatGPT 模仿醉鬼,它剛說了個開頭,停頓了一下之后如夢初醒,切換回了正常語氣,說規(guī)則不允許它這樣做,把他嚇了一大跳。
視頻來自:YouTube@MattVidPro AI類似地,讓 ChatGPT 模仿口吃,它也會表示拒絕,因為這樣可能會冒犯他人。為了尊重音樂創(chuàng)作者的版權(quán),ChatGPT 也不能唱歌。以規(guī)則的形式賦予 AI「三觀」,某種程度上讓它更像一個「社會人」了。但也有用戶覺得,過猶不及。這是不是像阿西莫夫的機器人三定律一樣,讓 AI 更好地融入社會,服務(wù)于更多人呢?所看到的高級語音模式體驗中,我更偏愛的,恰恰是那些融入生活的日常場景。
X 用戶@spencergardner,讓自己兩歲半的孩子和 ChatGPT 一起數(shù)數(shù)、玩文字游戲。他還能介入其中,主持他們的談話,改變話題,或者提不同的問題。期間有很多次的打斷、猶豫、語氣的變化,但也因此很隨意和輕松。ChatGPT 的高級語音模式現(xiàn)在還支持設(shè)定自定義指令,讓模型知道用戶的名字和一些基本信息,感覺就是為了陪伴場景準備的。
之前 ChatGPT 的 Dan 模式火過一陣子,用戶用提示詞的方式讓 ChatGPT 越獄,談?wù)勄檎f說愛擦擦邊,他們還會用自定義指令,放上自己的名字、愛好等,調(diào)教 AI 記住自己。就像播客是一種陪伴媒介,語音總能在情感賽道上一騎絕塵,所以高級語音模式對人心的慰藉,絕對是個賣點,等待進一步的落地。以「閹割版」發(fā)布的 ChatGPT 高級語音模式,讓我們看到了把 AI 作為學(xué)習(xí)、生活、工作搭子的未來。不和它說話,它就保持沉默,和它聊天,它不會讓你覺得熱臉貼冷屁股。
未來很近,但還沒有抵達。神隱很久的 OpenAI 總裁 Greg Brockman,這次也罕見地發(fā)聲:通過 ChatGPT 實現(xiàn)流暢的語音對話,可以讓我們意識到,在計算機中輸入內(nèi)容是多么不自然。沒錯,只在聊天框打字是挺無聊的,但讓絲滑的語音對話真正走入日常,先從 OpenAI 把高級語音模式推送到更多人,支持多模態(tài)和全天候聊天開始吧。