作者
|
王兆洋
OpenAI CEO Sam Altman投資的人類歷史上第一款真正的AI硬件AI Pin,是這兩天全世界最火爆的硬件產(chǎn)品。如果你還不清楚這個產(chǎn)品,可以看這個視頻了解一下。
它背后的公司Humane,由前蘋果功勛設(shè)計師Imran Chaudhri和蘋果前系統(tǒng)負責人Bethany Bongiorno創(chuàng)辦,Chaudhri曾參與初代iPhone的開發(fā),甚至那個被喬布斯在iPhone第一次發(fā)布時嘲笑的帶著滾輪的原型機也是他參與設(shè)計的。他離開蘋果時非常不愉快,在決定離職前發(fā)全員郵件并寫了首詩:“可悲的是河流干涸了,這時你就會尋找新的河流”。然后,蘋果就開除了他。
Humane背后最大股東就是Sam Altman,而作為一款硬件的AI Pin,它的“軟件”就是GPT-4。它的發(fā)布跟OpenAI那場屠殺了一眾AI初創(chuàng)公司的開發(fā)者大會幾乎是前后腳,Sam Altman又是它的金主爹,關(guān)于它的討論立刻圍繞“是否是新的iPhone”展開。
然而仔細看看AI Pin,會發(fā)現(xiàn)它的意義不是非黑即白要么iPhone殺手,要么完全就是炒作,并不是這樣。它其實是AI時代“新硬件”思路的第一批試驗品。用我的同事駱軼航的話說,它是“ChatGPT的硬插件”。
喬布斯的門徒深知喬布斯的密碼:交互方式上極致激進改造,用戶體驗上極致保守克制,一如當年iPhone的樣子。
AI Pin最大的噱頭是沒有了屏幕,因而一舉改變了交互方式。你只能大部分時間通過自然語言,小部分時候通過手勢操控來使用它。這完全是基于ChatGPT的能力定制的,因為LLM(大語言模型)最大的革命之一就是推動了LUI(語言用戶界面)的普及,而這個AI Pin幾乎就是一個要把LUI用到極致的玩法。
這也決定了它是個實驗品。最近國內(nèi)一款數(shù)億用戶的國民級應(yīng)用產(chǎn)品負責人對我說,他們已經(jīng)是用LUI改造產(chǎn)品很徹底的產(chǎn)品,很多底層代碼都重寫了,但他認為LUI并不是一個單純的替代升級,而是一個帶來新可能性并行選擇。LUI最終會結(jié)合GUI(手勢用戶界面)一起,創(chuàng)造屬于AI時代的硬件產(chǎn)品。
AI Pin就是這么干的。有的功能用自然語言調(diào)用,有的則用簡單的手勢,這也是讓外界驚呼酷炫的點,看完它的Demo,我覺得這其實就是AI Agent的“硬件化”。一個大模型有了一個Pin的實體,把它別在你的胸口,bling-bling地閃瞎眼,或者干脆像另一家AI硬件創(chuàng)業(yè)公司Rewind那樣,把它變成一個吊墜。這可能會變成一個潮流。
可是AI Pin,無論從長相到功能,聽上去是不是有點兒像10年前有一家做“智能胸針”的Misfit?那會兒有很多這種雞肋式的“可穿戴設(shè)備”,還有風靡得快消失得更快的Google Glass。AI Pin的終局會不會跟它們一樣?
回答它得回到對“智能”的理解上。10年前的Google Glass也好,Misfit也罷,還有五花八門的智能手環(huán)和智能手表,難道本質(zhì)上不都是“智障硬件”嗎?至少有一點你得相信,有了GPT-4當“軟件”,AI Pin確實開啟了“智能”硬件的新階段。它的核心能力,在于用語言交互和動作交互,調(diào)用AI Agent;蛘吒纱,你就直接把AI Pin當成掛在胸口bling-bling閃瞎旁人眼的一個AI Agent。
AI Agent本質(zhì)是基于個人或組織定制需求的,以大語言模型為核心能力的AI應(yīng)用和功能的組合,它具有高度的個性化和場景化導(dǎo)向:敲一下胸口的Pin,跟它低聲說兩句話,展開手掌,看到一串亮色的字符,告訴你對一個問題的建議處理方式,一個關(guān)鍵的要告訴對方的數(shù)據(jù),或者直接替你點好了你另一只手拿的一份餐廳菜單。這可比那些手表手環(huán)聰明多了。當然這也說明,與傳統(tǒng)意義上的硬件不同,AI Pin本身不會是一個通用的硬件,而是實現(xiàn)定制化AI的“硬插件”。
既然是“硬插件”,背后自然是一整個新的體系。這個新體系不再是以某個硬件為出發(fā)點,出發(fā)點變成了大語言模型;仡櫼幌耰Phone當年是先有的iPhone再有的App Store,以至于蘋果今天在營收上仍然是一個硬件公司。那么如果是先有了一個強大的“App Store”呢?OpenAI和AI Pin拿的就是這么一個反過來的劇本。
誰都知道人們關(guān)注AI Pin,是因為它背后的OpenAI和ChatGPT,AI Pin的創(chuàng)始人自己也知道。就像軟件開發(fā)者的收入依賴蘋果的硬件所以甘愿被蘋果收稅一樣,AI Pin第一天就把硬件收入讓位于訂閱收入Humane的定價方式:是固定的硬件價格和每個月的“訂閱費”調(diào)用GPT-4的能力向OpenAI繳的“稅”。這和ChatGPT的插件們邏輯有任何的不同么?
OpenAI相信,大語言模型的本質(zhì)就是個世界知識的最棒的壓縮器。但壓縮器不能直接解決每個人每個具體問題,所以需要插件,AI Agent的思路因此出現(xiàn)。今天,新一代硬件在追逐“AI原生”時也在被這種思路塑造:以基礎(chǔ)大語言模型為底,以一個能壓縮基礎(chǔ)模型并用個人數(shù)據(jù)訓(xùn)練的“大腦”為中心,再輔佐上各種硬插件最終每個人都有個性化的AI Agent。
AI Pin是想激進地一步到位做到這一點的。只不過早期實驗越想一步到位,也越容易成炮灰。它直接把插件接底座,帶來很多問題。最多的詬病之一是隱私。而如果有一個本地的且計算能力更強的中間“保險箱”,插件可以更集中在自己的任務(wù),后面的基礎(chǔ)模型可以更通用,那就可以解決更多問題。
前不久我在硅谷遇到與Humane相似的當紅創(chuàng)業(yè)公司Rewind的CEO Dan Siroker,他展示了把Rewind做到電腦上離線使用的功能,這會更安全更個人化(Rewind也比Humane更激進,它的產(chǎn)品要全天候記錄用戶的一舉一動,對隱私問題更敏感),而在他看來基礎(chǔ)模型和插件之間的那個“大腦”,依然需要由手機和電腦承擔,只不過需要的是全新的用模大語言型能力來定義的新手機新電腦。從這個意義上,我們還是挺期待英偉達和聯(lián)想把電腦變成“AIPC”,以及高通幫助vivo和小米們把大模型塞到手機里的。
結(jié)論基本有了:AI Pin是一個把ChatGPT別在你胸口的,消滅了觸摸屏幕的,讓語言交互界面與手勢交互界面組合操作的“硬插件”。它是一個隨身攜帶的AI Agent,一個硬件底座直接與云連接,相當激進,比當年的Google Glass還激進,這意味著它更像是一個實驗品,但人們需要這樣的實驗品。
只有激進的嘗試才能激發(fā)想象力。這是人們對AI Pin如此興奮的原因。人們把它當成了“奧特曼的插件”,也就是ChatGPT在硬件世界的延伸,一個可能的新的硬件時代的開啟。這倒讓我想起了15年前的一段往事。
2008年6月,舊金山,蘋果WWDC ,App Store在那一刻正式發(fā)布。喬布斯在臺上說:“你們也可以像Apple自己一樣來開發(fā)和發(fā)布應(yīng)用”。接著,幾名最早期的蘋果開發(fā)者上臺了。其中一個穿粉衣服的男孩引起喬布斯注意。喬布斯把這個粉衣男生叫到他陰暗的房間里聊天,這名24歲的斯坦福輟學(xué)生緊張而興奮,后來回憶稱“只看得到他(指喬布斯)反著光的兩個圓圓的鏡片”。當時,他在臺上展示自己的App的,表達對蘋果的感謝:“這是新的移動時代的開始”。
這名粉衣男生就是Sam Altman。