本文作者:李丹
來源:硬AI
OpenAI為期12個(gè)工作日的新產(chǎn)品和技術(shù)發(fā)布活動(dòng)出了新王炸:在首次公開演示將近七個(gè)月后,OpenAI正式面向廣大付費(fèi)用戶推出ChatGPT類人高級(jí)人工智能(AI)語音助手的新功能,實(shí)時(shí)視頻對(duì)話。
美東時(shí)間12月12日周四,OpenAI宣布,在ChatGPT的移動(dòng)端應(yīng)用程序App中,上線ChatGPT高級(jí)語音模式Advanced Voice的視頻和共享屏幕功能。Advanced Voice由OpenAI的多模態(tài)模型GPT-4o支持。
OpenAI的研究員在直播中演示了任何運(yùn)用新功能,點(diǎn)擊ChatGPT 聊天欄旁邊的語音圖標(biāo),然后點(diǎn)擊左下角的視頻圖標(biāo),就可以啟動(dòng)視頻對(duì)話。如果想共享屏幕,手機(jī)用戶要點(diǎn)擊打開一個(gè)有三個(gè)喧囂的菜單,選擇其中的“共享屏幕”(Share Screen)。
在和ChatGPT的視頻對(duì)話中,OpenAI研究員提問,研究員先讓GPT看到并和現(xiàn)場(chǎng)的OpenAI工作人員分別打過招呼,然后問GPT,現(xiàn)場(chǎng)誰的打扮最像圣誕老人,誰像圣誕老人的馴鹿,GPT均作出準(zhǔn)確而回答。研究員演示了,給GPT轉(zhuǎn)發(fā)一個(gè)短信內(nèi)容及圖片,讓GPT建議如何回復(fù)對(duì)方的短信。
研究員還演示了,利用Advanced Voice的新功能讓GPT幫忙校對(duì)或者通過GPT學(xué)習(xí)新東西。比如找出一些制作手沖咖啡的咖啡壺、過濾杯等工具,向GPT展示并詢問如何使用這些工具,在操作時(shí),讓GPT評(píng)價(jià)做得如何,并給出建議。
OpenAI表示,大多數(shù)ChatGPT Plus和 Pro套餐的訂閱用戶以及所有Team用戶都將可以在今后幾天內(nèi)通過ChatGPT的App訪問周四推出的新功能,預(yù)計(jì)歐盟、瑞士、冰島、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用戶也將很快可以運(yùn)用新功能。ChatGPT的企業(yè)版和教育版Enterprise和Edu將于明年1月上線新功能。
同時(shí)OpenAI宣布,在Advanced Voice這一高級(jí)語音模式中,新增了“限時(shí)”的圣誕老人聲音作為“節(jié)日特供”,有效期持續(xù)到明年1月初,在全球范圍內(nèi),所有移動(dòng)、網(wǎng)絡(luò)和桌面App用戶都可選用,它可通過 ChatGPT 中的雪花圖標(biāo)訪問。
華爾街見聞曾提到,今年5月OpenAI就在推出新旗艦?zāi)P虶PT-4o時(shí)演示了語音模式Voice Mode,不過該模式真正落地一波三折。
OpenAI原計(jì)劃6月末向一小批Plus計(jì)劃用戶推出該語音模式,6月又宣布推遲一個(gè)月發(fā)布,以便確保該功能安全有效地處理來自數(shù)百萬用戶的請(qǐng)求。當(dāng)時(shí)OpenAI稱,計(jì)劃今年秋季讓所有Plus用戶都可以訪問該功能,確切的時(shí)間表取決于是否達(dá)到內(nèi)部對(duì)安全性和可靠性的高標(biāo)準(zhǔn)。
7月末,OpenAI對(duì)有限的部分付費(fèi)Plus用戶推出高級(jí)語音模式下的ChatGPT,稱語音模式無法模仿他人的說話方式,且增加了新的過濾器,保證軟件能夠發(fā)現(xiàn)并拒絕某些生成音樂或其他形式受版權(quán)保護(hù)音頻的請(qǐng)求。當(dāng)時(shí)上線的語音模式缺少5月OpenAI展示過的不少功能,比如計(jì)算機(jī)視覺功能,類似于本周四OpenAI宣布將要推出的視頻對(duì)話答問。
(更多精彩科技資訊,點(diǎn)擊這里進(jìn)入全天候站點(diǎn))