12月初,亞馬遜云科技一年一度的re:Invent大會在美國拉斯維加斯大會召開,來自世界各地的超6萬名參會者,他們脖子上佩戴著不同顏色的牌子,穿梭于各個會場之間。
re:Invent大會一直就以務(wù)實著稱,但這一屆發(fā)布的產(chǎn)品之多,連很多連續(xù)參會的資深專家都感覺到信息過載僅僅在三天時間里,亞馬遜云科技CEO Matt Garman與高級副總裁Peter DeSantis、AI和數(shù)據(jù)副總裁Swami博士就發(fā)布了超過30+新品,涵蓋推理芯片、AI服務(wù)器、大語言模型、生成式AI開發(fā)工具等等。
在親身感受這些密集的產(chǎn)品發(fā)布過程,可以清晰地提煉出亞馬遜云科技開會和演講的套路,那就是在服務(wù)客戶過程中我們發(fā)現(xiàn)了XX問題,于是我們就推出了XX工具,非常簡單直給。
作為亞馬遜云科技最早、也是應(yīng)用最深入的客戶,亞馬遜CEO Andy Jassy時隔多年再次亮相re:Invent,這次他不僅一口氣發(fā)布了6款A(yù)mazon Nova模型(包括4款基礎(chǔ)模型,1款圖像生成模型和1款視頻生成模型),更是作為亞馬遜云科技最早、也是應(yīng)用最深入的客戶(據(jù)他透露,亞馬遜內(nèi)部已構(gòu)建或正在構(gòu)建近1000個生成式AI應(yīng)用程序),他分享的關(guān)于亞馬遜應(yīng)用AI的三個核心問題選擇、成本和需求,完全可以作為理解本次大會的基本邏輯。搞懂了這三個問題,再看這30多個產(chǎn)品發(fā)布的背后思路就很清晰了。
更自由的選擇
“當(dāng)你嘗試構(gòu)建某些東西或者做決策時,常常需要在A和B之間做選擇嗎?這種選擇其實限制了你的思路。在亞馬遜云科技,我們不這么思考問題!眮嗰R遜云科技一年一度的re:Invent大會上,亞馬遜云科技CEO Matt Garman在主題演講時,這樣表達(dá)了對技術(shù)應(yīng)用的理解。
Matt認(rèn)為,“做選擇”實際上制造了虛假邊界,“讓你馬上開始想自己必須選A或者選B,但我們推動團(tuán)隊去思考如何同時達(dá)成A和B,就可以讓大家換一種方式思考”。
在Matt眼中,開發(fā)者與客戶永遠(yuǎn)有選擇最優(yōu)產(chǎn)品的權(quán)利。這是亞馬遜云科技成立時秉承的理念,無論是一兩百款EC2,還是上百款數(shù)據(jù)庫亞馬遜云科技一直都認(rèn)為,客戶的需求大于一切,那么需求的多樣性就決定了選項的多樣性。
亞馬遜云科技愿景文件撰寫于2003年。彼時,眾多科技公司紛紛構(gòu)建捆綁式的解決方案,試圖大包大攬。最終形成的是龐大而單一的解決方案,雖功能全面卻僅達(dá)合格水準(zhǔn)。但合格不應(yīng)是追求的終點,人們真正渴望的是最優(yōu)組件。若能將所有頂尖元素整合一體,那才堪稱完美!盎诖四,亞馬遜云科技應(yīng)運而生!盡att說。過去18年,靈活的技術(shù)構(gòu)建模塊,也成為亞馬遜云科技服務(wù)逐漸向上的執(zhí)念。
這一理念也表現(xiàn)在時下熱議的大模型服務(wù)上!霸趤嗰R遜內(nèi)部構(gòu)建項目中所使用模型的多樣性令人驚訝。給予了開發(fā)者自主選擇的權(quán)利,原本以為大家都會選用Anthropic的Claude模型,畢竟過去一年多它在全球?qū)儆谛阅茼敿獾哪P,確實有很多內(nèi)部開發(fā)者在使用Claude模型,但他們也會采用Llama模型、Mistral模型,甚至?xí)褂米孕醒邪l(fā)的模型!盇ndy Jassy演講時談及亞馬遜落地生成式AI的經(jīng)驗,“因為一直都在汲取同一個教訓(xùn),那就是永遠(yuǎn)不會出現(xiàn)一種工具能在某個領(lǐng)域一統(tǒng)天下的情況。就像數(shù)據(jù)庫領(lǐng)域,探討了10年,大家會使用各種各樣的關(guān)系型數(shù)據(jù)庫或者非關(guān)系型數(shù)據(jù)庫;就像大數(shù)據(jù)領(lǐng)域討論了很久是不是TensorFlow會一統(tǒng)天下,結(jié)果PyTorch更受歡迎!
Amazon Bedrock Marketplace是Swami博士在現(xiàn)場發(fā)布的其中一款新品。這是一個擁有100多個領(lǐng)先大模型的“市場”,Amazon Bedrock中的統(tǒng)一體驗極大簡化模型開發(fā)工作流程,給用戶帶來了前所未有的靈活度,將讓模型推理從“非A即B”的選擇達(dá)到成本與延遲的“微妙平衡”。
“對一個因素的優(yōu)化通常需要對另一個因素進(jìn)行妥協(xié),這是因為成本和響應(yīng)延遲與道德準(zhǔn)確性呈反比關(guān)系,因為功能更強大、高度智能的模型會消耗更多的資源!盨wami博士講述從客戶了解到的需求。而在更新的Bedrock上,新模型蒸餾功能,使得用戶可以將特定知識從更大、更準(zhǔn)確的模型轉(zhuǎn)移到更小、更高效的專業(yè)模型,使其速度提高500%,成本降低75%。
但是多元化的選擇,也難免面臨一些天然存在的競合關(guān)系,比如亞馬遜云科技在向客戶提供模型市場、模型開發(fā)平臺的同時,也推出了自己的基礎(chǔ)模型。不過,亞馬遜云科技一直以來都是開放性的看待這種競合關(guān)系。
對于亞馬遜云科技的模型策略,Andy Jassy做了這樣的回答:“我們一直以來的目標(biāo)就是為大家提供選擇,現(xiàn)實情況是,大家在不同的時間、出于不同的原因,都會使用不同的模型。
這其實反映了現(xiàn)實世界的運行規(guī)律。就好比人類不會只找一個人去獲取各個領(lǐng)域的專業(yè)知識一樣,不同的人在不同的方面各有所長。有時候大家會側(cè)重于優(yōu)化編碼,有時候關(guān)注數(shù)學(xué),有時候看重與檢索增強生成(RAG)的集成,有時候聚焦智能需求,還有時候在意更低的延遲或成本問題。大多數(shù)情況下,是各種因素的組合決定的。
在亞馬遜云科技,我們會為大家提供這些因素組合之后,滿足需求的選擇。我們認(rèn)為,最近又為這個組合增添了一些非常有趣的模型。好消息是,所有這些模型都能在Amazon Bedrock中使用,大家可以按照自己期望的任何組合去使用它們,進(jìn)行試驗,并根據(jù)情況做出相應(yīng)的調(diào)整。”
可接受的成本
云計算的成本問題,一直是Matt最為關(guān)心的問題。
2018年,亞馬遜云科技曾經(jīng)做過一個瘋狂且頗具爭議的決定:開發(fā)自己的芯片。即Amazon Graviton,以期在ARM內(nèi)核變得越來越快、越來越強大的背景下提供差異化價值。現(xiàn)在,Amazon Graviton被幾乎每個亞馬遜云科技客戶廣泛使用。Amazon Graviton提供比x86高40%的性價比、減少60%的能源消耗,也極大縮減了云計算成本。
以圖片分享網(wǎng)站Pinterest為例。在轉(zhuǎn)向Amazon Graviton之前,Pinterest運行著數(shù)千個x86實例來運營他們的業(yè)務(wù)。轉(zhuǎn)向Amazon Graviton之后,Pinterest將計算成本降低了47%,碳排放減少了62%!八麄儾⒉还聠,90%的前1000個Amazon EC2客戶都開始使用Amazon Graviton!盡att說。
現(xiàn)在,生成式AI時代來了,當(dāng)下最大的計算問題都與AI相關(guān)。雖然與NVIDIA有著長達(dá)14年的合作關(guān)系(搭載NVIDIA新Blackwell芯片的Amazon EC2 P6服務(wù)器將于明年年初推出),也是NVIDIA的大型生成式AI集群場所,但GPU依然成了亞馬遜云科技為計算降本的新目標(biāo):推出一款專為尖端生成式AI訓(xùn)練和推理這類高要求工作負(fù)載而設(shè)計的GPU。
會上,亞馬遜云科技最強Amazon EC2 Trn2計算實例發(fā)布。配備16個Trainium2芯片,一個Amazon EC2 Trn2實例可在單個計算節(jié)點提供20.8 petaflops的計算能力,Amazon EC2 Trn2實例提供比當(dāng)前GPU服務(wù)器高出30%到40%的性價比,這些芯片通過一種稱為NeuronLink的高帶寬、低延遲互連連接在一起。
AI大模型公司Anthropic聯(lián)合創(chuàng)始人兼首席計算官Tom Brown12月2日在re:Invent演講時當(dāng)場宣布,下一代的Claude模型將在Project Rainier上進(jìn)行訓(xùn)練,他表示這將是一個新的計算集群,擁有數(shù)十萬個Amazon Tranium2芯片。優(yōu)化完成后,該集群預(yù)計將成為迄今為止世界上最大的AI計算集群,可供Anthropic構(gòu)建和部署其未來模型。
“數(shù)十萬個芯片意味著數(shù)百個密集的億次浮點運算,比我們曾經(jīng)使用過的任何集群都多五倍以上。這意味著客戶將可以更低的價格、更快的速度獲得更多的智能。有了Amazon Tranium2 和Project Rainier,我們不僅僅是在構(gòu)建更快的人工智能,還在構(gòu)建可擴(kuò)展的、值得信賴的人工智能!盩om Brown表示。
Andy Jassy在演講時也多次談及“成本”,他認(rèn)為當(dāng)生成式AI應(yīng)用程序達(dá)到一定規(guī)模時,計算成本的重要性就凸顯出來了,大家都迫切希望獲得更高的性價比,即既能控制好延遲,也要具備合理的成本結(jié)構(gòu)。據(jù)他觀察,從全球范圍來看,那些應(yīng)用AI最為成功的公司,主要體現(xiàn)在成本規(guī)避和生產(chǎn)力提升方面,而且很多公司在這兩方面都取得了進(jìn)展。但值得一提的是,亞馬遜云科技的成本控制,是體現(xiàn)在整場的產(chǎn)品創(chuàng)新上,而非簡單的價格。
需求導(dǎo)向,實用AI
如果一定要給亞馬遜云科技的AI戰(zhàn)略做一個定義,需求導(dǎo)向的實用AI或許更為精確。
“很多時候,人們用上不錯的模型做了些工作,就以為打造出很棒的生成式AI應(yīng)用程序了,但實際上可能只完成了大概70%的工作,而客戶不會喜歡存在那30%問題的應(yīng)用程序!盇ndy Jassy表示。以亞馬遜自己為例,加入生成式AI這個“智慧大腦”之后,亞馬遜聊天機器人客戶滿意度提升了500個基點,“這就是實用AI的體現(xiàn)。”Andy Jassy說。
客戶至尚和逆向工作法,是亞馬遜云科技DNA的一部分。亞馬遜云科技創(chuàng)業(yè)初期,由于合規(guī)性、審計、監(jiān)管、安全、加密等考量,大部分的銀行客戶表示愿意采用云計算,但稱可能永遠(yuǎn)不會上云。亞馬遜云科技沒有放棄這些金融客戶,而是接下來花了十年來解決銀行客戶清單上的每一個問題!敖裉欤液茏院赖卣f,許多大型金融公司都是我們的客戶。因此,當(dāng)你在創(chuàng)新時,重要的是要記住,你真的要從客戶開始。你要問他們什么對他們重要,但你不僅僅是交付客戶要求的東西。你要為他們發(fā)明!盡att說。
AI時代也是同理:要為客戶發(fā)明好用的AI工具。
會上,Swami博士發(fā)布了新一代Amazon SageMaker。從功能上看,SageMaker AI與客戶的數(shù)據(jù)強相關(guān),是一個集合了數(shù)據(jù)調(diào)用、數(shù)據(jù)分析、大模型訓(xùn)練的一站式平臺,定位上發(fā)生了重大的變化。
“許多客戶向我們反饋,他們的分析和AI工作負(fù)載越來越多地圍繞相同的數(shù)據(jù)和相同的工作流程進(jìn)行融合。這正在改變其對分析服務(wù)的看法,因為事實證明,他們不再僅僅孤立地使用分析和AI工具,他們正在使用歷史分析數(shù)據(jù)來訓(xùn)練機器學(xué)習(xí)模型,并且越來越多地將相同的數(shù)據(jù)納入其生成式AI應(yīng)用程序中!盡att談及從一個客戶案例中獲得的啟發(fā)。這也不難理解,因為數(shù)據(jù)才是企業(yè)的核心資產(chǎn),才是差異化的競爭力,而非模型,將企業(yè)絕對優(yōu)勢的數(shù)據(jù)和大模型整合在一個平臺上,才會有優(yōu)勢。
綜合來看,對客戶來說,AI落地的工具越來越多;對亞馬遜云科技來說,他們又用一年的時間把AI生態(tài)這個木桶所有的木板都加長了一大截;對行業(yè)來說,這個市場又被卷緊了好幾圈,競爭的焦點也逐漸從大模型本身轉(zhuǎn)移到了工具和落地上。
附:亞馬遜云科技re:Invent2024產(chǎn)品發(fā)布全景(筆者現(xiàn)場整理)
(本文首發(fā)于鈦媒體APP,作者 | 秦聰慧,編輯 | 劉湘明)
更多精彩內(nèi)容,關(guān)注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App