劃重點(diǎn)
01微軟AI CEO穆斯塔法蘇萊曼接受WIRED專(zhuān)訪,詳解Copilot愿景、AI智能體的三個(gè)階段以及與OpenAI的關(guān)系。
02Copilot旨在創(chuàng)造一種伙伴間的持續(xù)互動(dòng)體驗(yàn),提供情感支持,分為信息處理、長(zhǎng)期記憶、交互三大階段。
03微軟對(duì)OpenAI的模型進(jìn)行了微調(diào),使其不僅專(zhuān)注于解決數(shù)學(xué)和科學(xué)問(wèn)題,還能進(jìn)行并列比較和消費(fèi)者分析。
04除此之外,微軟本月宣布其AI助手Copilot升級(jí),類(lèi)似人類(lèi)的聲音、能看到用戶的屏幕、擁有更好的推理能力。
05蘇萊曼認(rèn)為,AI伙伴在未來(lái)將能代表用戶購(gòu)買(mǎi)東西、談判、簽訂合同,甚至規(guī)劃周六下午的日程。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
智東西(公眾號(hào):zhidxcom)
編輯 | Panken
智東西10月18日消息,近日,微軟AI CEO穆斯塔法蘇萊曼(Mustafa Suleyman)接受WIRED專(zhuān)訪,詳細(xì)解讀了微軟Copilot愿景、AI智能體(AI Agent)的三個(gè)階段、微軟與OpenAI的關(guān)系、AI后續(xù)挑戰(zhàn)等焦點(diǎn)話題。
蘇萊曼說(shuō),微軟Copilot旨在創(chuàng)造一種伙伴間的持續(xù)互動(dòng)體驗(yàn),不僅關(guān)乎技術(shù),更在于提供情感支持;AI智能體分為信息處理、長(zhǎng)期記憶、交互三大階段;微軟對(duì)OpenAI的模型進(jìn)行了微調(diào),使其不僅專(zhuān)注于解決數(shù)學(xué)和科學(xué)問(wèn)題,還能進(jìn)行并列比較和消費(fèi)者分析。
微軟本月宣布其AI助手Copilot升級(jí)類(lèi)似人類(lèi)的聲音、能看到用戶的屏幕、擁有更好的推理能力。對(duì)此蘇萊曼稱(chēng),這都是讓用戶重新愛(ài)上PC的計(jì)劃的一部分。
微軟全球資深副總裁、微軟AI亞太區(qū)總裁張祺博士總結(jié)了此次訪談的啟示:
“2024年諾貝爾獎(jiǎng)的各個(gè)獎(jiǎng)項(xiàng)已經(jīng)全部揭曉,令人矚目的是,諾貝爾物理學(xué)獎(jiǎng)與化學(xué)獎(jiǎng)雙雙花落AI領(lǐng)域。AI技術(shù)及其應(yīng)用成為今年諾獎(jiǎng)最大的亮點(diǎn)。諾獎(jiǎng)對(duì)AI相關(guān)成果及科學(xué)家的高度認(rèn)可,不但有力地推動(dòng)了AI技術(shù)的進(jìn)一步發(fā)展和跨學(xué)科研究的深化,也預(yù)示著AI將以更快的速度推動(dòng)人類(lèi)社會(huì)的經(jīng)濟(jì)增長(zhǎng)和高質(zhì)量發(fā)展。
AI的發(fā)展速度驚人,這在人類(lèi)歷史上尚屬首次機(jī)器學(xué)會(huì)了運(yùn)用我們的語(yǔ)言。但AI所提供的信息能否符合人類(lèi)的認(rèn)知需求和價(jià)值判斷?AI能否真正理解語(yǔ)言背后的情感內(nèi)涵?在AI與人類(lèi)深度交互的背景下,如何確保數(shù)據(jù)和隱私安全?從長(zhǎng)遠(yuǎn)來(lái)看,哪些挑戰(zhàn)可能成為制約AI可持續(xù)發(fā)展的根本性因素?
在直面這些難題的同時(shí),蘇萊曼先生對(duì)如何最大限度利用技術(shù)滿足用戶需求給出了一個(gè)清晰的路線圖。他探討了人工智能的發(fā)展、倫理問(wèn)題以及未來(lái)的技術(shù)前景。這正是本次蘇萊曼先生采訪帶來(lái)的啟示 。”
以下是穆斯塔法蘇萊曼與WIRED資深記者Will Knight的深度訪談實(shí)錄:
一、Copilot目標(biāo)提供情感支持,Vision功能完全保護(hù)用戶隱私
主持人:Copilot的新愿景是什么?
穆斯塔法蘇萊曼:我們正處于一個(gè)驚人的轉(zhuǎn)型點(diǎn)。AI伙伴現(xiàn)在能夠看到我們所見(jiàn),聽(tīng)到我們所聽(tīng),并使用我們溝通的同一種語(yǔ)言。這種新的設(shè)計(jì)理念關(guān)注的是持久性、關(guān)系和情感。我正在打造一種體驗(yàn),是關(guān)于與伙伴進(jìn)行持久、持續(xù)互動(dòng)。
主持人:你從Inflection AI加入微軟,該公司專(zhuān)注于構(gòu)建支持性和同理心的AI。聽(tīng)起來(lái)你把這種理念帶到了新的雇主這里。
穆斯塔法蘇萊曼:我一直相信AI有提供支持的潛力。情感支持實(shí)際上是我19歲時(shí)開(kāi)始工作的第一個(gè)項(xiàng)目,那時(shí)我啟動(dòng)了一項(xiàng)電話咨詢服務(wù)。這正是這個(gè)技術(shù)時(shí)刻的美妙之處體驗(yàn)與一個(gè)真正了解你的AI伙伴互動(dòng)。它會(huì)指導(dǎo)你、鼓勵(lì)你、支持你、教導(dǎo)你。我認(rèn)為這將不再讓人感覺(jué)像是在跟一臺(tái)計(jì)算機(jī)互動(dòng)。
主持人:Copilot Vision是什么?這個(gè)“實(shí)驗(yàn)室”功能將讓Pro用戶嘗試到什么?
穆斯塔法蘇萊曼:Copilot Vision讓你能夠說(shuō)“那邊的東西是什么[在你的屏幕上]?”或“等一下,那是什么?你覺(jué)得那個(gè)怎么樣?”在你坐在電腦前時(shí),會(huì)有很多這樣的小瞬間。這個(gè)AI伙伴可以看到你所見(jiàn),并實(shí)時(shí)與你討論你正在看的內(nèi)容,這是非常了不起的。它在某種程度上改變了你在數(shù)字生活中的體驗(yàn),因?yàn)槟悴槐卦儋M(fèi)力輸入內(nèi)容。
主持人:這聽(tīng)起來(lái)像是Recall,那項(xiàng)有爭(zhēng)議的、現(xiàn)在需要選擇的Windows功能,用于記錄用戶屏幕上的內(nèi)容。
穆斯塔法蘇萊曼:保護(hù)用戶的隱私是至關(guān)重要的。目前我們不會(huì)用Copilot Vision保存任何內(nèi)容,因此一旦會(huì)話結(jié)束后關(guān)閉瀏覽器,所有內(nèi)容都會(huì)消失,完全刪除。但我在思考是否以及如何在未來(lái)引入這一功能,因?yàn)楹芏嗳舜_實(shí)希望有這樣的體驗(yàn)。
如果你可以說(shuō),“我前幾天在網(wǎng)上看到的那張圖片是什么?那個(gè)表情包是什么?”我想我們總有一天得研究這個(gè)問(wèn)題。不過(guò)目前,Copilot Vision工具是這樣的。我們需要隨著時(shí)間進(jìn)行實(shí)驗(yàn),看看如何在這方面做更有意義的事情。
二、新功能類(lèi)似于OpenAI“草莓”模型,針對(duì)消費(fèi)者需求做調(diào)整
主持人:你們還推出了Think Deeper,這將使Copilot能夠處理更復(fù)雜的問(wèn)題。這是基于OpenAI的o1模型,也就是Strawberry,對(duì)嗎?
穆斯塔法蘇萊曼:是的,類(lèi)似于Strawberry。我們對(duì)OpenAI的模型進(jìn)行了調(diào)整,為了更符合消費(fèi)者的需求,我們讓它以一種更符合AI伙伴主題的方式運(yùn)行。
主持人:有什么區(qū)別?
穆斯塔法蘇萊曼:OpenAI的模型更專(zhuān)注于純數(shù)學(xué)和科學(xué)問(wèn)題的解決。我們?cè)噲D讓它專(zhuān)注于并列比較和消費(fèi)者分析等內(nèi)容。當(dāng)你在解決一個(gè)難題時(shí)卡住了,想要推理時(shí),它可以真正列出一個(gè)并列比較,或者進(jìn)行大規(guī)模分析。
主持人:微軟的人們已經(jīng)在使用這個(gè)新版本的Copilot了嗎?
穆斯塔法蘇萊曼:是的,大家都在使用。我們幾天前剛在公司內(nèi)部全面上線。所以每個(gè)人都在使用,并且提供大量反潰我們的反饋渠道非常繁忙,這很有趣。
三、朝AI伙伴邁進(jìn)一步,AI智能體三大階段解讀
主持人:人們會(huì)記得Clippy,微軟最后一個(gè)Windows AI助手。那里的員工有看到相似之處嗎?
穆斯塔法蘇萊曼:我前幾天見(jiàn)到了比爾蓋茨,他說(shuō),你知道嗎,你給整個(gè)AI的命名搞錯(cuò)了?應(yīng)該叫Clippy(回形針)。這確實(shí)顯示了蓋茨這樣的人的前瞻性。他們不僅能預(yù)見(jiàn)未來(lái)兩年,還能預(yù)見(jiàn)未來(lái)二十年。
主持人:新功能是否是朝著所謂的AI伙伴邁進(jìn)了一步,AI伙伴可以在電腦上幫你處理有用的瑣事嗎?
穆斯塔法蘇萊曼:是的,絕對(duì)是。
第一階段是AI處理與用戶相同的信息看到用戶所見(jiàn)、聽(tīng)到用戶所聽(tīng)、閱讀用戶閱讀的文本。
第二階段是AI具備長(zhǎng)期、持續(xù)的記憶,隨著時(shí)間的推移建立起共同理解。
第三階段是AI通過(guò)發(fā)送指令和采取行動(dòng)與第三方互動(dòng)比如購(gòu)買(mǎi)東西、預(yù)訂?wèn)|西、規(guī)劃日程。
我們正在研發(fā)實(shí)驗(yàn)?zāi)J街械倪@兩個(gè)功能。
主持人:你們有一個(gè)可以為你去購(gòu)買(mǎi)東西的Windows AI智能體嗎?
穆斯塔法蘇萊曼:這還有一段時(shí)間,但是的,我們已經(jīng)形成了閉環(huán),我們已經(jīng)完成了交易 。這項(xiàng)技術(shù)的問(wèn)題是,你可以讓它在50%到60%的時(shí)間里正常工作,但要讓它達(dá)到90%的可靠性還需要付出很多努力。
我已經(jīng)看到了一些令人驚嘆的演示,其中它可以獨(dú)立啟動(dòng)并進(jìn)行購(gòu)買(mǎi)等等。但我也見(jiàn)過(guò)一些事故的時(shí)候,它不知道自己在做什么。
主持人:能多告訴我一點(diǎn)“事故”的事嗎?它是否用蓋茨的信用卡去買(mǎi)了輛蘭博基尼?
穆斯塔法蘇萊曼:如果它用的是蓋茨的信用卡,那就好笑了。但不,如我所說(shuō)我們還在一步步摸索。這項(xiàng)技術(shù)仍然身處實(shí)驗(yàn)室的困境中,還有很長(zhǎng)的路要走,但我想進(jìn)展可以按季度來(lái)計(jì)算,而不是按年。
四、AI的未來(lái)挑戰(zhàn):打造可信賴技術(shù),建立親密和個(gè)性化體驗(yàn)
主持人:在實(shí)現(xiàn)你所描述的人工智能未來(lái)的過(guò)程中,你面臨的最大挑戰(zhàn)是什么?
穆斯塔法蘇萊曼:最大的挑戰(zhàn)是找出如何打造可信的技術(shù),因?yàn)檫@將是一種非常親密和個(gè)人的體驗(yàn)。當(dāng)然我們必須做好安全和隱私的部分。但我認(rèn)為真正的關(guān)鍵在于設(shè)計(jì)對(duì)話,使AI伙伴能夠明確邊界,能夠說(shuō)出“這是我不準(zhǔn)備參與的事情”。
如果我們能做到這一點(diǎn),那就是建立可信體驗(yàn)的基礎(chǔ),然后我認(rèn)為我們可以真正進(jìn)入復(fù)雜的領(lǐng)域,例如如何讓它代表你購(gòu)買(mǎi)東西、代表你談判、代表你簽訂合同,或者為你規(guī)劃一個(gè)周六下午涉及三四個(gè)不同站點(diǎn)的日程。你會(huì)說(shuō),我相信你,Copilot,你能搞定,對(duì)嗎?這正是我們正在努力實(shí)現(xiàn)的目標(biāo)。
來(lái)源:微軟,WIRED