今年的蘋(píng)果 WWDC,是一場(chǎng)事先張揚(yáng)的 AI 發(fā)布會(huì),庫(kù)克罕見(jiàn)地從幾個(gè)月前就在各種場(chǎng)合渲染氣氛。
可當(dāng)你上個(gè)月看過(guò) OpenAI 和 Google 、微軟的發(fā)布會(huì),又會(huì)覺(jué)得這不像一場(chǎng) AI 發(fā)布會(huì)。
蘋(píng)果甚至沒(méi)有正式發(fā)布一款大模型,沒(méi)有對(duì)比友商參數(shù)量、多模態(tài)能力這些常規(guī)環(huán)節(jié),沒(méi)談 AGI 的未來(lái),也沒(méi)有祭出像 Copilot 這種被媒體高呼「顛覆一切」的爆款應(yīng)用。
蘋(píng)果反而造了一個(gè)叫 Apple Intelligence(下稱(chēng)「Apple 智能」)的詞,這個(gè)諧音梗是在告訴人們,蘋(píng)果發(fā)布的不是一款軟件或硬件,而是一種新的用戶(hù)體驗(yàn)。
庫(kù)克認(rèn)為 AI 必須以用戶(hù)為中心,需要無(wú)縫集成到你日常使用的體驗(yàn)中:
它必須了解你,并基于你的個(gè)人背景,比如你的日常生活、你的人際關(guān)系、你的溝通等等,所有這一切都超出了人工智能的范圍。這是個(gè)人智能,也是蘋(píng)果公司的下一個(gè)重大舉措。
蘋(píng)果選擇將 AI 能力滲透到整個(gè)生態(tài)之中,這意味著很難看到 GPT-4o 那種讓人歡呼的演示,但這種「沒(méi)有驚喜」和去年 iPhone 15 發(fā)布時(shí)有所不同,那是智能手機(jī)宏大敘事終結(jié)的側(cè)寫(xiě)。
而 Apple 智能,是在給 AI 應(yīng)用鋪墊一種新的敘事,這可能不只是蘋(píng)果的新篇章。
個(gè)人智能和個(gè)人隱私
在 Apple 智能亮相時(shí),蘋(píng)果就總結(jié)了它的五個(gè)特點(diǎn):強(qiáng)大、易用、深度整合、個(gè)人化、私人化。
要想讓 AI 融合生活細(xì)節(jié),甚至不被察覺(jué),得讓 AI 甚至比你還了解你自己。這也意味著你的個(gè)人數(shù)據(jù)越多,就越可能實(shí)現(xiàn),隨后不能不面對(duì)的問(wèn)題就是:這是否要建立在讓渡個(gè)人隱私的基礎(chǔ)上實(shí)現(xiàn)?
這也是今天發(fā)布會(huì)后,馬斯克批評(píng)蘋(píng)果的由來(lái)。
他甚至直接在庫(kù)克的推文下表示「要禁止所有蘋(píng)果設(shè)備進(jìn)入我公司的辦公場(chǎng)所」,并對(duì)蘋(píng)果和 OpenAI 合作后用戶(hù)隱私安全的保護(hù)提出質(zhì)疑。
其實(shí)這也的確是用戶(hù)會(huì)擔(dān)憂(yōu)的問(wèn)題,尤其對(duì)于活躍設(shè)備高達(dá) 22 億的蘋(píng)果。但這也和蘋(píng)果對(duì)隱私保護(hù)一向慎重的行事風(fēng)格相悖。
過(guò)去蘋(píng)果設(shè)備和 AI 相關(guān)的功能基本都是依靠本地機(jī)器學(xué)習(xí)實(shí)現(xiàn)的,所需的數(shù)據(jù)量很少,很大程度上就是基于對(duì)個(gè)人隱私的考慮。
雖然蘋(píng)果在發(fā)布會(huì)上對(duì)這些問(wèn)題沒(méi)有一一介紹,但我們通過(guò)會(huì)后的一些媒體分享會(huì),也了解到更多 Apple 智能在隱私方面的處理方式,可以試著厘清目前網(wǎng)絡(luò)上爭(zhēng)議較大的一些問(wèn)題。
APPSO 獲悉,蘋(píng)果針對(duì)涉及云端的數(shù)據(jù)處理提供了兩個(gè)新的解決方案。
首先,用戶(hù)不必將所有數(shù)據(jù)、所有郵件、所有消息、所有照片、所有文檔發(fā)送到別人的云端并存儲(chǔ)在那里,以便服務(wù)器模型在需要時(shí)可以探測(cè)它們。
相反,用戶(hù)的設(shè)備上的 Apple 智能會(huì)找出哪些小部分信息與回答這個(gè)問(wèn)題相關(guān)。因此,向云端提出的問(wèn)題只包含這些小部分信息,而蘋(píng)果對(duì)小部分信息再進(jìn)行保密處理。
蘋(píng)果創(chuàng)建了一個(gè)加密系統(tǒng),比如 iPhone 只能與帶有指定標(biāo)簽的服務(wù)器通信。換句話(huà)說(shuō),如果這臺(tái)服務(wù)器上的軟件有任何更改,其簽名也會(huì)隨之改變,而你可以拒絕與其通信。
包括和 OpenAI 合作的用戶(hù)數(shù)據(jù)處理也是,擁有注冊(cè)賬號(hào)的用戶(hù) IP 地址在使用服務(wù)時(shí)會(huì)被隱藏掉,OpenAI 也不被允許記錄用戶(hù)請(qǐng)求。
這或許會(huì)在一定程度解答公眾的疑惑,蘋(píng)果也的確有必要在這方面披露更多信息。強(qiáng)調(diào)「?jìng)(gè)人化」的 Apple 智能,要實(shí)現(xiàn)發(fā)布會(huì)上的藍(lán)圖,這是必須要處理好的問(wèn)題。
而且蘋(píng)果和 OpenAI 的合作模式很可能并非獨(dú)家,未來(lái)在不同的場(chǎng)景,不同的地區(qū),顯然是保留了其他大模型合作的空間。
這也并非蘋(píng)果一家廠商要面臨的問(wèn)題,但無(wú)論是誰(shuí)都必須慎重挑選合作伙伴,當(dāng) AI 隨著大量終端設(shè)備滲透生活,隱私和便利的交鋒會(huì)愈加激烈,即便被認(rèn)為是忍受度更高的中國(guó)市場(chǎng)亦是如此。
一場(chǎng)沒(méi)有硬件的發(fā)布會(huì),卻對(duì)硬件影響很大
Apple 智能從命名到實(shí)現(xiàn)方式,都看出蘋(píng)果要以自己的方式來(lái)定義 AI 硬件,將 AI 能力滲透到整個(gè)生態(tài)之中,而不是推出某一個(gè)殺手級(jí)應(yīng)用和功能。
這是和目前大量 AI 硬件最大的不同,去年開(kāi)始硬件廠商掀起了 AI 硬件的潮流。當(dāng)中不少都是將 AI 硬件簡(jiǎn)單等同于大模型+終端設(shè)備,結(jié)果就是推出的往往是某個(gè)功能,更新實(shí)驗(yàn)性質(zhì)的半成品。
這也是 Ai Pin 和 Rabbit R1 等網(wǎng)紅 AI 硬件熱鬧一波就折戟沉沙的重要原因。
Apple 智能的思路和過(guò)去機(jī)器學(xué)習(xí)在蘋(píng)果產(chǎn)品的應(yīng)用方式類(lèi)似,盡管蘋(píng)果不怎么提 AI ,但已經(jīng)融入到很多常用的小功能,比如 AirPods Pro 自適應(yīng)音頻模式也是通過(guò)機(jī)器學(xué)習(xí)實(shí)現(xiàn)。
很多人說(shuō)在大模型時(shí)代蘋(píng)果已經(jīng)掉隊(duì),從單一技術(shù)上來(lái)說(shuō)很可能的確如此,但蘋(píng)果需要的從來(lái)不是一個(gè)比 ChatGPT 更牛逼的模型,而是將算力轉(zhuǎn)化為整體而非局部的體驗(yàn)。
雖然這場(chǎng)發(fā)布會(huì)系統(tǒng)和軟件是主角,但硬件是沒(méi)有被明示但卻至關(guān)重要的一環(huán)。APPSO 了解到,這次 Apple 智能在端側(cè)運(yùn)行的是規(guī)模在 30 億參數(shù)的模型。
蘋(píng)果對(duì)此低調(diào)但卻充滿(mǎn)信心,據(jù)悉蘋(píng)果工程師認(rèn)為這是目前最好的端側(cè)模型。
作為對(duì)比,不久前微軟發(fā)布的端側(cè)小模型 Phi-Silica 參數(shù)為 33 億,而國(guó)內(nèi)手機(jī)廠商在端側(cè)大部分場(chǎng)景的模型大約在 70 億-130 億參數(shù)之間。
參數(shù)越高大概率意味著更高的性能,但如果能以更小的參數(shù)規(guī)模實(shí)現(xiàn)同樣的性能,這對(duì)移動(dòng)設(shè)備和大模型的結(jié)合有更大的意義。
而且業(yè)內(nèi)很多研究已經(jīng)證明,經(jīng)過(guò)微調(diào)的小模型性能在某些使用場(chǎng)景下未必不如大模型。蘋(píng)果此前曝光的開(kāi)源小模型 OpenELM ,就涵蓋 2.7 億、4.5 億、11 億和 30 億參數(shù)。
盡管蘋(píng)果認(rèn)為用戶(hù)看重的是體驗(yàn),并非參數(shù)規(guī)模,但端側(cè)模型大概率是蘋(píng)果在悄悄發(fā)力的地方。
如果順利,蘋(píng)果極有可能推動(dòng)一波新的硬件浪潮,從 Vision Pro 到帶攝像頭的 AirPods,以及傳言中的家務(wù)機(jī)器人等。憑借強(qiáng)大的設(shè)計(jì)生產(chǎn)和供應(yīng)鏈能力,蘋(píng)果可以重新用軟件來(lái)塑造硬件。
這場(chǎng)沒(méi)有發(fā)布任何新硬件的發(fā)布會(huì),可能才是近年來(lái)對(duì)蘋(píng)果硬件影響最大的一次發(fā)布會(huì)。
Siri 將成為蘋(píng)果真正的操作系統(tǒng)
當(dāng)蘋(píng)果要將 AI 的能力集成到操作系統(tǒng)中,Siri 就成為重要的橋梁。
在今天的媒體分享會(huì)上,蘋(píng)果公司機(jī)器學(xué)習(xí)和人工智能戰(zhàn)略高級(jí)副總裁 John Giannandrea 就表示:
Siri 不再僅僅是一個(gè)語(yǔ)音助手,它實(shí)際上成為了一種設(shè)備系統(tǒng)。
我們之前在 WWDC 前瞻文章也預(yù)測(cè)過(guò),蘋(píng)果 AI 最終的目標(biāo)是實(shí)現(xiàn)這樣的場(chǎng)景:早上起床,用一句「Siri」喚醒 Siri,再讓它打開(kāi)微信公眾號(hào)「愛(ài)范兒」,朗讀最新的文章,就這樣在完全不用動(dòng)手的情況下,聽(tīng)取愛(ài)范兒的早報(bào)。
Siri 能變聰明,其實(shí)就是語(yǔ)義理解能力的提升,能像人一樣理解所有這些數(shù)據(jù)的含義。隨著時(shí)間的推移,這種理解會(huì)變得更加豐富。
大模型興起后的自然交互語(yǔ)言,一直被認(rèn)為將取代我們現(xiàn)在和設(shè)備的圖形界面 GUI,背后是計(jì)算機(jī)對(duì)自然語(yǔ)言的理解能力大幅提升。
基于自然語(yǔ)言的交互到來(lái),影響的不只是我們的隨身設(shè)備,應(yīng)用的形態(tài)也將完全改變,比如 Siri 通過(guò) API 調(diào)用具體的能力執(zhí)行各種任務(wù),甚至 app 都將不需要了,或以一種新的形態(tài)出現(xiàn)。
OpenAI 已經(jīng)離職的聯(lián)合創(chuàng)始人 Andrej Karpathy 也表達(dá)了類(lèi)似的觀點(diǎn),他認(rèn)為這是 Apple 最令人興奮的地方,并列舉了六點(diǎn)理由:
多模態(tài) I/O:支持文本、音頻、圖像和視頻的讀寫(xiě)功能。這些可以說(shuō)是人類(lèi)的原生 API。代理性:允許操作系統(tǒng)和應(yīng)用程序的所有部分通過(guò)「函數(shù)調(diào)用」進(jìn)行互操作;內(nèi)核進(jìn)程的 LLM 可以根據(jù)用戶(hù)查詢(xún)調(diào)度和協(xié)調(diào)工作。無(wú)縫體驗(yàn):以高度無(wú)縫、快速、始終在線(xiàn)的方式完全集成這些功能。無(wú)需復(fù)制粘貼信息或提示工程,相應(yīng)地調(diào)整 UI。主動(dòng)性:不僅是根據(jù)提示執(zhí)行任務(wù),而是預(yù)測(cè)提示、提供建議并主動(dòng)執(zhí)行。委派層級(jí):盡可能多地在設(shè)備上運(yùn)行智能(Apple Silicon 非常適用),但也允許將工作委派到云端。模塊化:允許操作系統(tǒng)訪問(wèn)和支持整個(gè)不斷增長(zhǎng)的 LLM 生態(tài)系統(tǒng)(例如 ChatGPT 的發(fā)布)。隱私保護(hù):<3
今天蘋(píng)果 WWDC 各種細(xì)節(jié),都在隱隱指向這個(gè)未來(lái)。但蘋(píng)果也知道這大概率還不會(huì)在幾年內(nèi)實(shí)現(xiàn),所以只告訴你,起碼 Siri 好用多了。
過(guò)去兩年,我們最不缺的,其實(shí)就是 AIGC 帶的「Amazing」。但猶如手機(jī)和互聯(lián)網(wǎng)那般,深度嵌入生活肌理的技術(shù)或產(chǎn)品,還不見(jiàn)端倪。
潤(rùn)物細(xì)無(wú)聲,才是技術(shù)革新的終極目標(biāo),也是 AI 的理想形態(tài),這也是 Apple 智能最值得期待的地方。