智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影
在生成式AI競賽中,亞馬遜云科技(AWS)多少有些“另類”。它不像其他云大廠那樣強調(diào)自研模型的頂尖性能,而是早早推出一個大模型貨架,集郵般擺上了各家頭部大模型,供客戶挑選。
“沒有一個模型能包辦一切”,這個被亞馬遜頻繁強調(diào)的理念,已經(jīng)逐漸深入人心。而在今年的年度云計算產(chǎn)業(yè)盛會re:Invent上,亞馬遜云科技卻又意外地發(fā)布全新大模型系列Nova的6款前沿模型,而且劇透了明年將發(fā)布的兩款特別模型語音到語音、任意到任意(Any-to-Any)。
這意味著亞馬遜云科技在重押美國大模型獨角獸Anthropic的同時,對自研模型也并未松懈。
在re:Invent期間,亞馬遜云科技生成式AI全球副總裁兼總經(jīng)理Vasi Philomin與智東西等少數(shù)媒體就這些問題進行了深入交流。他談到當前文本模型需求最大,語音到語音也非常流行(如實時同傳翻譯),任意到任意則是更遠的未來。
任意到任意模型屬于多模態(tài)到多模態(tài),用戶可以輸入文本、語音、圖像或視頻等多種形式的內(nèi)容,并相應地輸出文本、語音、圖像或視頻。
Vasi Philomin向我們解釋說,任意到任意模型適用于變化很多的情況,比如不能確定是圖像還是視頻類型。“你不能把任意到任意模型用作文本到文本的模型,”他強調(diào)道,“它可能成本挺高,但效果反而不好!
最強未必是最優(yōu)解,好用才是硬道理。
整場re:Invent大會都在源源不斷地傳遞一個信號亞馬遜云科技的生成式AI競爭力勝在全面,有琳瑯滿目的大模型品類,還有加速從訓練到推理的各種工具“套餐”,以及圍繞平臺、存儲、網(wǎng)絡、數(shù)據(jù)庫的一系列升級……一切變動都指向一個目的,即讓云客戶更快更方便地用生成式AI產(chǎn)生價值。
一、大模型貨架上新:不會厚此薄彼,提供試用機會
新發(fā)布的Nova基礎模型包括Micro、Lite、Pro、Premier模型,Micro是純文本模型,后三者都是多模態(tài)模型,還有文生圖模型Canvas和文生視頻模型Reel。這些模型都支持微調(diào)和蒸餾,還與Amazon Bedrock的知識庫深度集成,可用于檢索增強生成(RAG)。
Vasi Philomin告訴智東西,亞馬遜云科技的每個新模型、新服務在面世前都會經(jīng)過內(nèi)部討論流程,Bedrock寓意“基石”,Nova寓意“新”。他說亞馬遜云科技不會公布模型參數(shù)的情況,怎么選擇取決于客戶想要擁有怎樣的靈活度。
“我們對所有的模型都一視同仁!弊鳛锳mazon Bedrock的負責人,Vasi Philomin稱自己的團隊非常中立,不會在模型間厚此薄彼。
定價由模型提供商設置,不同情況下有很多不同的考量。亞馬遜云科技沒有去綁定某一個特定的模型,始終向客戶提供選擇的空間。
大模型只是生成式AI應用創(chuàng)新的一部分。亞馬遜云科技的全托管AI平臺Amazon Bedrock除了提供了各種大模型外,還有專門的試用服務。客戶可以在嘗試后根據(jù)效果和價位進行綜合考慮。
此外,亞馬遜云科技提供有模型版本政策,在模型生命周期結(jié)束的時候(即新產(chǎn)品不再使用時),會再給客戶6個月的時間。在Vasi Philomin看來,一些新老版本替代會占用計算資源,從成本、效率的角度不見得劃算,換個新的可能更省錢。
亞馬遜云科技對Nova模型性價比很有信心,稱它們比Amazon Bedrock中的其他領先模型大約便宜75%。
二、Amazon Bedrock五大功能:挑選模型,結(jié)合數(shù)據(jù),構(gòu)建Agent
在re:Invent大會上,亞馬遜CEO Andy Jassy分享了亞馬遜內(nèi)部構(gòu)建近1000個生成式AI應用所積累的三條經(jīng)驗:
1、當生成式AI應用達到一定規(guī)模,計算成本的重要性就凸顯出來。客戶普遍希望獲得更高性價比。
2、打造一個真正優(yōu)質(zhì)的生成式AI應用程序頗具難度,除了有好模型,還要設置恰當?shù)摹白o欄”,保證消息傳遞流暢,擁有合適的用戶界面,讓用戶用起來不卡頓,而且要具備合理的成本結(jié)構(gòu)。
3、不會出現(xiàn)一種工具一統(tǒng)天下的情況。開發(fā)者并沒有一窩蜂地選用性能最頂尖的模型,會采用不同模型,也會采用一些自研模型。
亞馬遜云科技在2023年9月推出的全托管AI平臺Amazon Bedrock則做到了上述能力的集合。據(jù)Vasi Philomin分享,該平臺已發(fā)展成亞馬遜云科技目前增長速度最快的服務。
亞馬遜云科技CEO Matt Garman稱Amazon Bedrock是目前構(gòu)建和擴展生成式AI應用最簡便的方式,尤其擅長為客戶提供將生成式AI集成到生產(chǎn)應用程序中所需的一切要素。
Amazon Bedrock的定位是幫助用戶更好地試用模型,主要有五大功能:1)選模型;2)找到成本性能和準確性的一個平衡;3)集成業(yè)務數(shù)據(jù);4)要集成業(yè)務的安全性;5)構(gòu)建Agent。
該平臺的多項發(fā)布和創(chuàng)新,也圍繞這五大功能展開。
首先在選模型上,除了亞馬遜云科技新發(fā)布的自研大模型Nova系列以及來自全球9家領先AI公司的高性能基礎模型外,這家云計算大廠還推出了Amazon Bedrock Marketplace,提供來自100多個新興和專業(yè)基礎模型,支持客戶用統(tǒng)一API來調(diào)用并利用Amazon Bedrock中的能力來構(gòu)建應用。
為了讓挑模型更省事,Amazon Bedrock智能提示詞路由功能可以動態(tài)地將請求路由到最有可能以最低成本出最佳響應的模型,在不影響準確性的情況下能將成本降低30%。這樣開發(fā)人員就不用花大量時間來試驗和找到最適合每個用例的模型。
其次在尋求業(yè)務需求、專業(yè)知識、預算與模型精度、成本、延時的平衡方面,模型蒸餾很有用。
模型蒸餾將特定知識從一個大而準確的教師模型蒸餾出一個更小但在特定場景中非常高效的定制模型。使用新推出的Amazon Bedrock模型蒸餾,蒸餾過的模型相比被蒸餾的模型,運行速度能夠快500%,成本降低75%,而且Amazon Bedrock會幫助搞定所有相關(guān)工作。
Amazon Bedrock新發(fā)布的延遲優(yōu)化推理選項、提示詞緩存功能也能進一步降低延遲,大幅縮減成本。
獲得合適模型后,下一步是將企業(yè)數(shù)據(jù)與智能模型相結(jié)合。
將數(shù)據(jù)添加到模型中并進行整合的一種熱門方法叫檢索增強生成(RAG),有助于模型基于企業(yè)數(shù)據(jù)提供更相關(guān)、更準確且更具定制化的回應。
亞馬遜云科技在今年早些時候推出了Amazon Bedrock知識庫功能,它屬于托管的RAG索引,能將所有的數(shù)據(jù)攝取、檢索及增強工作流實現(xiàn)自動化,無需用戶自行對這些環(huán)節(jié)進行全面管理。
客戶只需將知識庫指向自己的數(shù)據(jù)源,它就會自動將其轉(zhuǎn)換為文本嵌入,然后存儲到一個向量數(shù)據(jù)庫中。這樣客戶就能隨時進行自動檢索了,并且所有的檢索結(jié)果都會自動包含引用信息,方便用戶知曉信息來源、提升理解程度。
知識庫已經(jīng)是Amazon Bedrock中最受歡迎的功能之一,并在持續(xù)添加新功能,比如新增對向量數(shù)據(jù)庫、結(jié)構(gòu)化數(shù)據(jù)檢索、GraphRAG的支持。
Amazon Kendra GenAI Index則能為知識庫提供語義準確性高的托管檢索方案,內(nèi)置超過40多個企業(yè)數(shù)據(jù)源。
Amazon Bedrock知識庫支持結(jié)構(gòu)化數(shù)據(jù)檢索、GraphRAG,可查詢各種來源的所有結(jié)構(gòu)化數(shù)據(jù),自動生成知識圖譜。新發(fā)布的Amazon Bedrock Data Automation功能則可以自動將非結(jié)構(gòu)化的多模態(tài)內(nèi)容轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),無需寫代碼,讓將多模態(tài)內(nèi)容用于生成式AI的過程變得更容易。
導入自己的企業(yè)數(shù)據(jù)后,需要考慮安全性和設定AI應用程序的功能邊界。
對此亞馬遜云科技推出了Amazon Bedrock Guardrails護欄功能,用于輕松定義應用程序的安全性,并實施負責任的AI檢查。使用這個功能,你可以限制AI應用只在特定領域回答問題。
針對模型幻覺問題,可行技術(shù)之一是自動推理,亞馬遜云科技在諸多幕后服務中都運用了該技術(shù)。這是一種能夠從數(shù)學角度證明某事正確的AI形式,通常被用于驗證系統(tǒng)是否按照既定要求運行,尤其適用于系統(tǒng)覆蓋面大到無法人工逐一查看,且有關(guān)于系統(tǒng)運行方式的知識庫的場景。
最新推出的是Amazon Bedrock自動推理檢查功能,可以對模型所做出的陳述進行準確性檢查,防止因模型幻覺而導致錯誤。
亞馬遜云科技還發(fā)布了Amazon Bedrock Guardrails多模態(tài)毒性檢測功能,能夠篩查非結(jié)構(gòu)化數(shù)據(jù)中可能包含的潛在有害內(nèi)容。
最后涉及到怎么利用優(yōu)質(zhì)數(shù)據(jù)采取行動。
亞馬遜云科技此前推出了Amazon Bedrock Agent功能,讓構(gòu)建智能體變得更容易?蛻糁恍栌米匀徽Z言描述想要Agent完成的任務,它就能快速構(gòu)建出來。被構(gòu)建出的Agent可以處理銷售訂單、編制財務報告、分析客戶留存情況等任務。背后用到的模型推理技術(shù)使Agent能分解工作流程,調(diào)用正確的API來執(zhí)行操作。
在此基礎上,針對多智能體并行操作的任務,亞馬遜云科技又推出了Amazon Bedrock多Agents協(xié)作功能,能夠構(gòu)建、部署和編排多個Agents,協(xié)同處理復雜的多步驟任務。
跟前面的做法差不多,客戶可以創(chuàng)建一個專為特定個性化任務設計的Agent,再創(chuàng)建一個監(jiān)督Agent,它就好比復雜工作流程的“大腦”,負責協(xié)調(diào)分配、確保多Agent之間能夠有效協(xié)作,并能設定哪些Agent能訪問機密信息,把原本難以協(xié)調(diào)的工程任務變得簡單易行。
總體來說,Amazon Bedrock的功能不止是為了方便客戶獲取業(yè)界先進模型,而是內(nèi)置了很多配套工具和工程化能力,可以讓實際業(yè)務與生成式AI結(jié)合的操作過程更方便、結(jié)果更奏效。
三、下一代Amazon SageMaker:數(shù)據(jù)分析和AI需求的統(tǒng)一訪問中心
生成式AI應用創(chuàng)新要取得成功,需要有AI ready的數(shù)據(jù)。因此,亞馬遜云科技發(fā)布了新一代Amazon SageMaker,從產(chǎn)品及品牌方面將其重新定位為“所有數(shù)據(jù)、分析和人工智能需求的中心”。
很多云客戶在數(shù)據(jù)的治理、發(fā)現(xiàn)、處理、分析以及生成式AI應用創(chuàng)新方面的需求越來越融合。對此,亞馬遜云科技發(fā)布了Amazon SageMaker Unified Studio。這是一個單一的數(shù)據(jù)和AI開發(fā)環(huán)境,整合了在亞馬遜云科技中分析師和數(shù)據(jù)科學家所使用的各種服務、查詢編輯器、可視化工具,以便客戶訪問組織中的所有數(shù)據(jù),并使用最適合的工具對其進行操作。
亞馬遜云科技還推出了面向應用程序的Zero-ETL,幫客戶無需構(gòu)建和管理數(shù)據(jù)管道,即可分析存儲在許多最受歡迎的第三方SaaS應用程序中的數(shù)據(jù)。
另一個新發(fā)布的Amazon SageMaker Lake House兼容Apache Iceberg,針對所有結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)源提供單一界面,跨不同數(shù)據(jù)源提供簡單統(tǒng)一的數(shù)據(jù)接入與訪問控制?蛻艨梢栽赨nified Studio中輕松處理所有數(shù)據(jù),也可以直接從任何支持Apache Iceberg的第三方AI或分析工具或查詢引擎訪問該功能。
為了一站式解決生成式AI全生命周期的問題,Amazon SageMaker AI將大數(shù)據(jù)分析、機器學習、模型開發(fā)和生成式AI方面的經(jīng)驗融合到一個統(tǒng)一平臺中,統(tǒng)一了數(shù)據(jù)、分析和AI工作流,從而幫助消除機器學習和分析生命周期中的重復勞動。
針對大規(guī)模參數(shù)帶來的模型訓練和推理挑戰(zhàn),亞馬遜云科技推出Amazon SageMaker HyperPod靈活訓練計劃和任務治理功能,以優(yōu)化計算資源管理。
靈活訓練計劃基于Amazon EC2容量塊,根據(jù)時間線和預算創(chuàng)建最佳訓練計劃,自動預留容量,設置集群,創(chuàng)建模型訓練作業(yè),能夠為數(shù)據(jù)科學團隊節(jié)省數(shù)周訓練時間,最大化計算資源利用率,可節(jié)省多達40%的成本。
任務治理功能針對管理跨團隊的和項目的計算資源的挑戰(zhàn),通過自動化生成式AI任務的優(yōu)先級排序和管理,確保分配給最高優(yōu)先級任務并按時完成,從而進一步提高開發(fā)效率并降低成本。
這兩個功能能夠大幅提高訓練和推理工作負載部署的靈活性和對底層硬件資源的使用,讓底層硬件資源發(fā)揮出更好效能。
此外,亞馬遜云科技宣布合作伙伴的AI應用已在Amazon SageMaker上可用。客戶無需預配或管理基礎設施,可加速模型開發(fā)生命周期,并有數(shù)據(jù)安全和隱私保障。
接下來一年,亞馬遜云科技還將為新的Amazon SageMaker添加大量新功能,如AutoML、低代碼體驗、專業(yè)化AI服務集成、流處理和搜索,以及Zero-ETL的更多服務和數(shù)據(jù)訪問。
四、生成式AI助手Amazon Q再進化,提升企業(yè)生產(chǎn)力
Amazon Q是在Bedrock上搭建起來的一個生成式AI助手應用。即使你沒有寫過一行Python代碼,你也可以用自然語言簡單陳述業(yè)務問題,它會指導你完成構(gòu)建機器學習模型的過程。
其中Amazon Q Developer是軟件開發(fā)方面的生成式AI助手,最新推出了3款全新自主Agent,能幫助開發(fā)人員生成單元測試、文檔、代碼審查。
針對從Windows、VMware進行現(xiàn)代化改造的情況,亞馬遜云科技提供了現(xiàn)代化Windows.NET應用、加速VMware工作負載和主機遷移的功能,以及首個支持IBM z/OS的主機遷移解決方案,可以大幅縮短遷移時間和成本,并顯著降低風險。
在運營環(huán)節(jié),亞馬遜云科技通過提供Amazon Q Developer Investigate issues across your Amazon environment in a fraction of the time功能,來幫助更輕松地排查問題。
企業(yè)級生成式AI助手Amazon Q Business可連接不同的業(yè)務系統(tǒng)、企業(yè)數(shù)據(jù)源,支持跨越各種數(shù)據(jù)庫與所有企業(yè)數(shù)據(jù)進行對話。Q Business為企業(yè)數(shù)據(jù)創(chuàng)建了一個索引,可以從Adobe、Microsoft Office、SharePoint、Gmail、Salesforce、ServiceNow等源中去索引過去一年的數(shù)據(jù),并對所有數(shù)據(jù)保持高度安全、控制用戶權(quán)限。
最新發(fā)布的功能是將Amazon QuickSight和Amazon Q Business的數(shù)據(jù)結(jié)合,以一種視圖呈現(xiàn),通過自然語言與Q系統(tǒng)對話,快速生成商業(yè)報告和數(shù)據(jù)分析,協(xié)助客戶做出更好的決策并提升業(yè)務效率。目前絕大多數(shù)信息都是通過商業(yè)智能系統(tǒng)來訪問的,已有超過10萬的客戶在使用Amazon QuickSight來滿足分析需求。
亞馬遜云科技提供了一套全新的Q BusinessAPI,以便獨立軟件供應商訪問在自有軟件中集成Amazon Q Index。
針對一些涉及多個應用程序、審批環(huán)節(jié)和手動輸入的復雜工作流,亞馬遜云科技新發(fā)布的Amazon Q Business Automate能夠幫助創(chuàng)建跨團隊和應用程序的自動任務,通過使用一系列高級Agent來創(chuàng)建、編輯、維護工作流程。在啟動工作流后,還會有一個Q Agent持續(xù)對其進行監(jiān)控,確保能夠自動調(diào)整并及時修復。以往完成這些工作可能需要花費數(shù)周或數(shù)月,而現(xiàn)在僅需幾分鐘。
結(jié)語:從服務、工具到基礎設施,全棧升級為生成式AI創(chuàng)造價值托舉
正如計算機科學先驅(qū)Alan Kay曾經(jīng)說過的,最好的軟件工程師自己會構(gòu)建硬件。新的云計算、生成式AI浪潮會推動在底層的持續(xù)創(chuàng)新,底層創(chuàng)新反之又會加速數(shù)據(jù)及AI的進一步發(fā)展。和傳統(tǒng)IT一樣,生成式AI需要計算、網(wǎng)絡、存儲基礎設施的托載,而這些恰恰是亞馬遜云科技長期積累的優(yōu)勢所在。
將業(yè)務和生成式AI結(jié)合需要很多工程化能力。在生成式AI發(fā)展的早期階段,亞馬遜云科技將其服務重心放在提供“最優(yōu)組合”上,將技術(shù)能力分解為獨立的構(gòu)建單元(building blocks),以高性價比組件的形式提供給客戶,讓客戶可以按照自己期望的任意組合去嘗試和調(diào)整,從而節(jié)省開發(fā)時間,加速探索生成式AI落地。
總體來看,亞馬遜云科技通過提供豐富的自研及第三方大模型貨架來滿足云客戶差異化需求,通過Amazon Bedrock解決大模型落地效率問題,通過Amazon SageMaker提高資源利用和數(shù)據(jù)分析的速度,通過Amazon Q讓人人都能簡便快捷地用上生成式AI生產(chǎn)工具,通過底層基礎設施的升級進一步降本增效。
這些投入在為廣泛客戶帶來更大商業(yè)回報的同時,也持續(xù)鞏固著這家云計算巨頭在生成式AI云服務市場的領導者地位和核心競爭力。