展會(huì)信息港展會(huì)大全

出道即巔峰,十年后卻“泯然眾人矣”,蘋果拿什么拯救 Siri?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2022-02-21 09:02:41   瀏覽:26354次  

導(dǎo)讀:作者 | James Vincent 譯者 | 核子可樂 策劃 | 劉燕 嘿,Siri,你怎么了? 經(jīng)過過去十余年的發(fā)展完善,蘋果傾力打造的語音助手 Siri,似乎還是沒有摸清門道。 2011 年 10 月,蘋果首度曝光其數(shù)字助手 Siri,其肩上承擔(dān)的勃勃野心可見一斑。 蘋果公司高管 Phi...

作者 | James Vincent

譯者 | 核子可樂

策劃 | 劉燕

嘿,Siri,你怎么了?

經(jīng)過過去十余年的發(fā)展完善,蘋果傾力打造的語音助手 Siri,似乎還是沒有摸清門道。

2011 年 10 月,蘋果首度曝光其數(shù)字助手 Siri,其肩上承擔(dān)的勃勃野心可見一斑。

蘋果公司高管 Phil Schiller 曾在 iPhone 4s 發(fā)布會(huì)上強(qiáng)調(diào),“幾十年來,技術(shù)專家們一直在嘲笑我們的這個(gè)夢(mèng)想。‘類似的噱頭玩了一遍又一遍,但從來沒能成真。’ ”

在 Schiller 看來,真正的問題在于以往的語音界面太過依賴簡(jiǎn)單的語法表達(dá)。“打給媽媽”、“呼叫 555-2368”、“播放貝多芬作品”等等。“但我們真正想要的,是跟自己的設(shè)備順暢交流。手機(jī)應(yīng)該能理解我們的意圖、并幫助我們完成相應(yīng)操作的手機(jī)功能。”說到這里,Schiller 翻開了下一頁幻燈片,后來為大家所熟悉的拋光鋁材質(zhì)麥克風(fēng)圖標(biāo)就此映入眼簾。“這就是我們的方案,Siri它將連同 iPhone 4s 一同面世。”

SCHILLER 指出,“我們真正想要的,是跟自己的設(shè)備順暢交流。”

Schiller 將 Siri 稱為一款“和藹的個(gè)人助手”。在蘋果公司的困難探索期,Siri 為 2011 年的 iPhone 注入了一針強(qiáng)心劑。而就在 4s 手機(jī)正式發(fā)布的幾個(gè)月前,蘋果公司一位不那么知名的雇員、時(shí)任首席運(yùn)營官的 Tim Cook 剛剛出任 CEO 職務(wù)。

Schiller 演講后的第二天,蘋果公司傳奇聯(lián)合創(chuàng)始人 Steve Jobs 因胰腺癌不幸辭世。分析師開始對(duì)蘋果的前景持冷淡態(tài)度,但也承認(rèn) Siri 有望成為潛在的游戲規(guī)則改變者。

有聲音稱 Siri 為“未來移動(dòng)設(shè)備使用方式的一種全新可能性”,也有人認(rèn)為它將成為“蘋果旗下一切移動(dòng)及 Mac 產(chǎn)品全新用戶體驗(yàn)的起點(diǎn)。”

但十年之后,Siri 的最后一點(diǎn)光芒也已褪去。

Schiller 曾在當(dāng)初的發(fā)布會(huì)上,用一句話總結(jié)了之前所有語音界面的表現(xiàn),“太讓人失望了。”但 Siri 顯然沒沒能消除這種失望感,每位用戶都在 Siri 上遇到過自己的“失望時(shí)刻 ”它可能沒聽懂一句簡(jiǎn)單的指令,甚至搞不定一項(xiàng)最基本的操作。

如今的語音界面雖然已經(jīng)全面普及,蘋果也確實(shí)是第一家攜成熟解決方案進(jìn)入市場(chǎng)的企業(yè),但并沒能把握住領(lǐng)先地位。Siri 仍然“和藹”,但與其說是和藹、不如說是軟弱:在移動(dòng)平臺(tái)上不如谷歌智能助手,在家居場(chǎng)景下也打不過亞馬遜 Alexa。

所以回顧蘋果個(gè)人助手這十年發(fā)展歷程,我們不得不思考這樣一個(gè)問題:嘿 Siri,發(fā)生了什么事?

1

最初的一切,確實(shí)美好

回顧 2011 年,剛剛誕生的 Siri 確實(shí)贏得了市場(chǎng)的熱烈回應(yīng),評(píng)論者對(duì)其迅捷的響應(yīng)速度和良好的準(zhǔn)確性印象深刻。

媒體 The Verge 曾經(jīng)斷言,“Siri 最牛的地方就是它的工作原理至少在大多數(shù)情況下,它的水平都能超出用戶的預(yù)期。”;CNN 的觀點(diǎn)則是,“它有點(diǎn)像我們夢(mèng)想中的免費(fèi)助理,隨叫隨到。”《紐約時(shí)報(bào)》也感慨,“Siri 幫我們節(jié)約了時(shí)間、消除了不必要的操作,并深刻改變了手機(jī)的定義。”

多么美好,蘋果似乎已經(jīng)兌現(xiàn)了自己的承諾。

但現(xiàn)在回看這些評(píng)論,對(duì)于 Siri 的贊譽(yù)的確有些言過其實(shí)。

Siri 當(dāng)初是靠著新穎性和勃勃雄心沖昏了評(píng)論家們的頭腦,但在后續(xù)使用中逐漸發(fā)現(xiàn)問題后,人們開始承認(rèn)這款軟件還僅僅處于測(cè)試階段。那時(shí)候大家還很樂觀,覺得不斷推出的補(bǔ)丁肯定能讓 Siri 逐漸成長為真正稱職的個(gè)人助手。

媒體 Ars Techinca 倒是比較清醒,早在 2011 年的評(píng)測(cè)中就發(fā)現(xiàn)了Siri 如今最受詬病的問題在嘈雜的環(huán)境中經(jīng)常聽錯(cuò)指令、做出錯(cuò)誤判斷。例如,用戶說出“給 Jason、Clint、Sam 和 Lee 發(fā)短信,說我們打算在 Silver Cloud 吃晚餐”,結(jié)果 Siri 理解成了“給 Jason 發(fā)短信,Clint、Sam 和 Lee 說我們?cè)?Silver Cloud 吃晚飯。”

2

SIRI 曾經(jīng)一馬當(dāng)先,但如今早已泯然眾人矣

Siri 的橫空出世令人驚艷,但沒過多久,市場(chǎng)上就出現(xiàn)了其他競(jìng)爭(zhēng)對(duì)手。

三星于 2012 年在 Galaxy S3 上推出了 S Voice;同一年,Google Now 推出了 Android 版本(隨后于 2016 年被 Google Assistaqnt 谷歌助手所取代);2014 年,微軟在 Windows Phone 上公布了 Cortana 小娜;同樣是 2014 年,亞馬遜走上一條獨(dú)特的道路,在 Echo 智能揚(yáng)聲器上首度推出 Alexa。

到這個(gè)時(shí)候,智能語音助手已經(jīng)已經(jīng)不再局限于手機(jī)平臺(tái),而是在各類計(jì)算設(shè)備上成為一種常規(guī)工具。

縱觀這個(gè)時(shí)期,人們對(duì)于智能助手的評(píng)論基本可以歸納成兩點(diǎn)。

首先,人們很快就玩膩了 Siri。在 4s 之后的幾代 iPhone 中,Siri 雖然也都會(huì)迎來增量式更新,但實(shí)際功能根本沒有跨越式的提升。更準(zhǔn)確地講,其變化著實(shí)有限,例如 iOS 6 中新增檢索體育賽事結(jié)果;iOS 7 中集成 Wikipedia;在 iOS 8 中引入“嘿,Siri”激活語……就這?沒錯(cuò),就這。

到 2017 年的 iPhone 8 時(shí)代,評(píng)測(cè)人士對(duì)于 Siri 已經(jīng)幾乎是一筆帶過。我們自己在當(dāng)初的評(píng)測(cè)中也就一句,“Siri 的語音聽起來自然多了,但除此以外跟之前沒多大區(qū)別。”

iPhone 4s 上的 Siri 憑借著前無古人的新穎定位引爆評(píng)論圈,但蘋果顯然沒能延續(xù)這股后勁。

第二個(gè)主要趨勢(shì)是,在競(jìng)爭(zhēng)對(duì)手陸續(xù)出現(xiàn)之后,蘋果的先發(fā)優(yōu)勢(shì)開始快速消退。

2012 年在對(duì) Siri 和三星 S Voice 進(jìn)行比較之后,我們發(fā)現(xiàn)后者已經(jīng)能夠提供與“蘋果數(shù)字助手非常接近的功能表現(xiàn)”,而 2014 年的單挑測(cè)試則證明“Google Now 已經(jīng)優(yōu)于 Siri”。到 2017 年,The Verge 提出 Siri 已經(jīng)“明顯跟不上時(shí)代發(fā)展”,用戶對(duì)它的不滿情緒也開始蔓延。

沒錯(cuò),它仍然能很好地回應(yīng)那些基本問題,但卻無法比較可靠地幫助用戶購買電影票或者點(diǎn)餐。我們折騰了一圈,往往發(fā)現(xiàn)還不如自己親自動(dòng)手。

回過頭來看,Siri 的大問題明顯在于沒能延續(xù)這股后勁。

時(shí)至今日,Siri 上利用率最高的功能仍然是 2011 年剛亮相時(shí)的那些 設(shè)個(gè)鬧鐘啦、記份便箋之類。雖然我們偶爾也能跟它閑聊一下,或者查查自己關(guān)心的球隊(duì)最近打贏比賽沒有,但 Siri 一直沒能像當(dāng)初承諾的那樣徹底顛覆使用習(xí)慣。

與此同時(shí),競(jìng)爭(zhēng)對(duì)手則達(dá)到并超越了 Siri 的水平,開始提供更可靠的聽寫結(jié)果、更出色的語言理解能力與更豐富的第三方功能集成。

到這時(shí)候,Siri 已經(jīng)落后于時(shí)代了。

3

高處不勝寒

那么,到底是哪里出了問題?蘋果 (Siri) 為什么就從學(xué)霸變成學(xué)渣了呢?答案其實(shí)相當(dāng)復(fù)雜。

不少人認(rèn)為蘋果對(duì)隱私保護(hù)的過度關(guān)注,注定他們沒法像谷歌那樣大量收集用戶數(shù)據(jù)、再利用這些資源改進(jìn)自己的 AI 系統(tǒng)。我個(gè)人覺得這應(yīng)該不是 Siri 失敗的主要原因,畢竟蘋果對(duì)用戶隱私的“尊重”也是有條件的。

2019 年,英國《衛(wèi)報(bào)》就透露蘋果曾把“一小部分 Siri 錄音轉(zhuǎn)交給承包商進(jìn)行分析,一名舉報(bào)人聲稱其中涉及醫(yī)患間的討論、商業(yè)交易、疑似非法交易、性接觸等內(nèi)容。

其次,蘋果是一家價(jià)值 2 萬億美元的公司,如果真的想規(guī)避由收集用戶數(shù)據(jù)引發(fā)的麻煩,他們完全可以花錢來合成數(shù)據(jù)。沒錯(cuò),隨機(jī)分析 Siri 交互當(dāng)然不錯(cuò),但也有其他辦法可以達(dá)到相同的改進(jìn)效果。

“Steve Jobs 在 Siri 推出后的第二天去世了,蘋果也由此失掉了前進(jìn)的方向。”另一個(gè)更有說服力的理由,是蘋果內(nèi)部出現(xiàn)了管理職能障礙。

2018 年,The Information 發(fā)布了一份關(guān)于 Siri 團(tuán)隊(duì)成員變動(dòng)的報(bào)告。可以看到,蘋果內(nèi)部對(duì)于 Siri 的基本定位出現(xiàn)了難以調(diào)和的分歧 到底該專注于搜索 / 檢索功能,還是成長為能執(zhí)行復(fù)雜任務(wù)的助手?

這些分歧源自 Steve Jobs 本人最初給 Siri 定下的框架,但隨后演變成不同派系之間“爭(zhēng)搶地盤與話語權(quán)的對(duì)抗”。于是,Siri 項(xiàng)目不斷經(jīng)歷著走馬換將,策略連續(xù)性的缺失讓情況不斷惡化。

正如一位前蘋果員工在接受 The Information 采訪時(shí)所言,“Jobs 在 Siri 推出后的第二天去世了,蘋果也由此失掉了前進(jìn)的方向。”這樣的論斷,確實(shí)符合 Siri 在之后多年里停滯不前的客觀現(xiàn)實(shí)。

蘋果的技術(shù)發(fā)展理念也給 Siri 壓上了一塊沉重的大石。

The Information 報(bào)道稱,蘋果公司高管 Richard Williamson 拍板決定每年只對(duì) Siri 進(jìn)行一次更新,用以匹配公司其他新款硬件和 iOS 系統(tǒng)的更新節(jié)奏。這顯然會(huì)拖慢 Siri 的前進(jìn)腳步。

但 Williamson 本人隨后駁斥了這種說法,還帶頭在 2012 年災(zāi)難性的 Apple Maps 功能推出時(shí)提出離職。另一位同樣先后參與過 Siri 與 Apple Maps 項(xiàng)目的高管 Scott Forstall 也在同年離職。

還有傳言說蘋果的“圍墻花園”理念阻礙了 Siri 的進(jìn)步,導(dǎo)致其在調(diào)用 iOS 功能時(shí)表現(xiàn)不錯(cuò),但卻很難與第三方服務(wù)順暢對(duì)接。

確實(shí),在籌備本篇文章時(shí),我驚訝地發(fā)現(xiàn) Siri 居然無法在幾乎人人在用的 iOS 應(yīng)用上實(shí)現(xiàn)最簡(jiǎn)單的功能。Siri 無法通過 WhatsApp 發(fā)送語音消息,無法將內(nèi)容發(fā)布至 Instagram,無法在 RunKeeper 上記錄跑步數(shù)據(jù),也沒法啟動(dòng)《紐約時(shí)報(bào)》應(yīng)用的填字游戲。

當(dāng)然,這種互操作性缺失也跟外部開發(fā)者的消極態(tài)度有關(guān),但蘋果不是更應(yīng)該發(fā)布友好易用的工具包、鼓勵(lì)其他開發(fā)商接入 iOS 生態(tài)嗎?

最后再說個(gè)沒得洗的問題,我讓 Siri 幫我查詢存儲(chǔ)在 iOS 本機(jī)中的信息,例如“讓我看看去年八月的照片”,結(jié)果它打開了瀏覽器、在里頭搜索名為“去年八月”的圖像……

相反,蘋果想借 Siri 這個(gè)跳板把人們引導(dǎo)回他們自己那套劣質(zhì)應(yīng)用庫里,這真的讓人很不爽。

如果我向 Siri 詢問路線,它就會(huì)提示我安裝 Apple Maps但你 Apple Maps 憑什么跟 Google Maps 和 Citymapper 爭(zhēng)?如果我想給老板發(fā)封郵件,Siri 會(huì)先回答“對(duì)不起,我不能這樣做”,然后引導(dǎo)我去 App Store 里下載蘋果的默認(rèn)郵件應(yīng)用……拜托,我用 Outlook 的好嗎?

而且這里很明顯能看出蘋果對(duì)于 Siri 的發(fā)展規(guī)劃有多么草率,因?yàn)樗?App Store 里搜索的詞條就是“手機(jī)郵箱”。這根本不是蘋果官方郵件應(yīng)用的名稱哎,而是 iOS“郵件”應(yīng)用的內(nèi)部開發(fā)代號(hào),所以這樣根本啥也搜不到。這還是我認(rèn)識(shí)的那個(gè)蘋果嗎?產(chǎn)品測(cè)試都沒做完就把功能上線啦?

而且這最后一點(diǎn),也凸顯出包括 Siri 在內(nèi)的、當(dāng)前各類語音界面方案的最大通玻

在 Schiller 于 2011 年首次推出 Siri 時(shí),曾一再強(qiáng)調(diào) Siri 可以理解用戶的意圖或者說,它能明白用戶在說什么,就跟真人一樣。

正是這樣的心理預(yù)期,讓我們對(duì)后來的 Siri 感到失望。其實(shí)如果我們認(rèn)定語音界面就該像真人那樣擁有一定的知識(shí)積累、生活常識(shí)和理解能力,那注定是要失望的。我們提問,它們答錯(cuò);我們出題,它們懵圈 也許這才是正常狀況。

使用中最讓人難受的,往往是它們支持不了我們認(rèn)為它們?cè)撝С值墓δ芑蛘呙睢K悦恳淮问《枷喈?dāng)于提醒了我們,別相信這個(gè)什么鬼助手。

相比之下,顯示屏上的交互界面才是真正的可靠,能做什么、不能做什么都清晰可循。相較于樸實(shí)無華的菜單、導(dǎo)航和按鈕,語音只是一種可有可無的娛樂手段。

所以我們本來對(duì) Siri 可以沒那么高期待的,都是蘋果當(dāng)初的爆炸式宣傳,讓我們產(chǎn)生了不切實(shí)際的幻想。

4

語音功能的未來

我給大家講個(gè)真實(shí)的故事。我在寫這篇文章時(shí)來了一輪中場(chǎng)休息,泡上茶后突然想起一小時(shí)后有個(gè)遠(yuǎn)程會(huì)議。

為了怕忘記,我就隨手來了個(gè)日常操作:讓 Siri 幫我設(shè)個(gè)提醒。

“Siri,提醒我差十分鐘五點(diǎn)的時(shí)候有個(gè)會(huì)。”Siri 回答得很痛快,“好的,已經(jīng)為您設(shè)好明早五點(diǎn)的鬧鐘:有個(gè)會(huì)。”

我又試了一次,這下 Siri 又給晚上十點(diǎn)設(shè)了個(gè)提醒。

第三次,我激活 Siri 之后思考了一下,想找個(gè)更容易理解的表達(dá)方式,然后 Siri 明顯等煩了,說道“你想讓我提醒你什么?”

放棄,果斷放棄。

5

蘋果其實(shí)丟不下 Siri

沒錯(cuò),Siri 之類的智能助手經(jīng)常讓人失望,但它們對(duì)客戶還是有著一定的吸引力,畢竟大家還是期待著它們終有一天能靠譜起來。而且語音界面再怎么不濟(jì),也確實(shí)代表著一種未來方向。

我經(jīng)常會(huì)用 Siri 完成一些快速操作,例如記筆記 、設(shè)置鬧鐘和進(jìn)行搜索等。只要不出毛病,它的效果還是頗令人滿意的。如果我們認(rèn)真學(xué)習(xí)一下蘋果快捷命令和常見家居設(shè)備操作,那 Siri 的表現(xiàn)還能更好。

作為一種輔助工具,語音控制和聽寫功能已經(jīng)在用戶中培養(yǎng)起新的使用習(xí)慣。自 2011 年蘋果 Siri 面世以來,蘋果生態(tài)中已經(jīng)出現(xiàn)了越來越多高度依賴于語音控制的產(chǎn)品。

無論是為了解決屏幕尺寸有限的問題(Apple Watch)、還是為了解決沒有輸入介質(zhì)的問題(AirPods、HomePod),Siri 都完成了一項(xiàng)項(xiàng)從不可能到可能的任務(wù)。

未來幾年,希望蘋果自家的增強(qiáng)現(xiàn)實(shí)眼鏡也能加入進(jìn)來,讓 Siri 多一塊施展的舞臺(tái)。所以,拜托蘋果認(rèn)真升級(jí)一下 Siri 吧,這真的很重要。

AirPods、HomePod 以及 Apple Watch總有一些產(chǎn)品需要、甚至完全依賴于 Siri。

這里說點(diǎn)好消息,有跡象表明蘋果公司正著手扭轉(zhuǎn)困局。

近年來,蘋果對(duì)于 AI 技術(shù)的關(guān)注度日益提升。從 2018 年挖直谷歌機(jī)器涫負(fù)責(zé)人、到內(nèi)部自研 AI 處理器、再到定期發(fā)布 AI 增強(qiáng)功能,蘋果的 AI 野心已經(jīng)不言自明。更重要的是,Siri 本身也迎來了一系列重大改進(jìn),并將在今年實(shí)現(xiàn)本機(jī)處理并開始支持第三方硬件。

但我個(gè)人還是心存懷疑。首先,即使是在執(zhí)行基本命令方面,Siri 的表現(xiàn)也不只是停滯不前、有時(shí)候還會(huì)倒退。在 iOS 15 中,蘋果刪除了 Siri 的大量功能,包括涉及筆記和照片的任務(wù);叫車和支付等第三方集成操作也被拿下。我最近還發(fā)現(xiàn)檢查語音郵件等基本命令好像也消失了,具體如何還有待驗(yàn)證。

在我看來,蘋果最大的問題是仍然沒想好 Siri 應(yīng)該是個(gè)什么定位。它到底只是提供一種通過語音控制手機(jī)的途徑(比如瀏覽應(yīng)用并查找內(nèi)容),還是像真正的助手那樣執(zhí)行復(fù)雜的任務(wù)?蘋果在宣傳材料中肯定是選擇了后者,但用戶卻發(fā)現(xiàn) Siri 的真實(shí)功能只局限于前者。

我們這幫媒體人長年接觸 AI 和機(jī)器學(xué)習(xí)內(nèi)容,所以很明白讓計(jì)算機(jī)真正聽懂人話仍是個(gè)遙不可及的長遠(yuǎn)目標(biāo)。語言這東西太復(fù)雜了,深深植根于人類的經(jīng)驗(yàn)與文化之內(nèi),根本不是靠統(tǒng)計(jì)模型就能強(qiáng)行解讀的。所以雖然出現(xiàn)了不少讓人印象深刻的新型語言系統(tǒng),但它們都不夠可靠,還支撐不起完美的數(shù)字化助手。

如果蘋果想要挽救 Siri,我覺得他們首先應(yīng)該重新設(shè)定期望值,之后專注于提升核心競(jìng)爭(zhēng)力。

其實(shí)把 Siri 發(fā)布會(huì)跟其他競(jìng)爭(zhēng)對(duì)手的宣傳內(nèi)容做出比較,我們就能看到有趣的區(qū)別。

例如,谷歌在 2016 年推出 Google Assistant 時(shí),重點(diǎn)并不是解決復(fù)雜任務(wù)、或者理解用戶提出的那些腦洞大開的問題;它的目標(biāo)只有一個(gè),拓展谷歌搜索功能的使用方式和使用范圍。

正是這種只做對(duì)一件事的定位,讓谷歌博得了用戶們的青睞。(當(dāng)然,后來他們也在宣傳中做出過不靠譜的承諾,這里就不展開了。)

相比之下,Siri 在 2011 年初登場(chǎng)時(shí)“牛吹得太大”,之后無論怎么努力也滿足不了用戶的胃口。所以蘋果最好能 “認(rèn)清形勢(shì)、放棄幻想”, 回歸原點(diǎn)再出發(fā)。

https://www.theverge.com/22704233/siri-apple-digital-assistant-10-years-development-problems-why


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港