展會信息港展會大全

AI的6000億美元難題何解?創(chuàng)企高管熱議大模型成本和商業(yè)化
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-10-27 16:36:49   瀏覽:521次  

導(dǎo)讀:劃重點 01RTE2024第十屆實時互聯(lián)網(wǎng)大會上,AI企業(yè)創(chuàng)始人熱議AI的6000億美元難題,從基礎(chǔ)設(shè)施到商業(yè)化落地。 02Lepton AI創(chuàng)始人兼首席執(zhí)行官賈揚清表示,同等尺寸的模型能力會越來越強,開源架構(gòu)的應(yīng)用會越來越普遍。 03然而,大模型訓(xùn)練和推理的成本問題仍備...

劃重點

01RTE2024第十屆實時互聯(lián)網(wǎng)大會上,AI企業(yè)創(chuàng)始人熱議AI的6000億美元難題,從基礎(chǔ)設(shè)施到商業(yè)化落地。

02Lepton AI創(chuàng)始人兼首席執(zhí)行官賈揚清表示,同等尺寸的模型能力會越來越強,開源架構(gòu)的應(yīng)用會越來越普遍。

03然而,大模型訓(xùn)練和推理的成本問題仍備受關(guān)注,面壁智能聯(lián)合創(chuàng)始人曾國洋認(rèn)為,算力成本優(yōu)化會最終轉(zhuǎn)化為訓(xùn)練更強大的模型。

04此外,AI安全和倫理問題引發(fā)討論,OpenAI解散其聚集于AI安全研究的“AGI Readiness”團(tuán)隊。

05聲網(wǎng)宣布與MiniMax正在打磨中國第一個Realtime API,音視頻多模態(tài)模型在實際應(yīng)用潛力受到關(guān)注。

以上內(nèi)容由騰訊混元大模型生成,僅供參考

新京報貝殼財經(jīng)訊(記者白金蕾 陳維城)10月25日至26日,由RTE開發(fā)者社區(qū)和聲網(wǎng)聯(lián)合主辦的RTE2024第十屆實時互聯(lián)網(wǎng)大會在京舉行。會上一場由Lepton AI創(chuàng)始人兼首席執(zhí)行官賈揚清,MiniMax合伙人魏偉,面壁智能聯(lián)合創(chuàng)始人、首席技術(shù)官曾國洋,Hugging Face工程師王鐵震等組成的針對“AI的6000億美元難題 :從基礎(chǔ)設(shè)施到商業(yè)化落地”的圓桌論壇,引發(fā)業(yè)界關(guān)注。

“AI的6000億美元難題”起源于紅杉資本的合伙人 David Cahn(大衛(wèi)卡恩)的文章,他認(rèn)為:AI(人工智能)基礎(chǔ)設(shè)施的巨額投資和實際收入之間差距過大,人工智能將要到達(dá)泡沫的臨界點;AI可能是下一個變革性的技術(shù)浪潮,GPU(圖形處理器)計算價格的下降,實際上對長期創(chuàng)新和初創(chuàng)公司是有利的,而投資者會受損。

AI的6000億美元難題何解?創(chuàng)企高管熱議大模型成本和商業(yè)化

RTE2024第十屆實時互聯(lián)網(wǎng)大會。圖|受訪者供圖

針對AI的基礎(chǔ)設(shè)施建設(shè),賈揚清分享了兩個核心觀點:同等尺寸的模型,能力會越來越強,尤其是通過蒸餾、壓縮等技術(shù),現(xiàn)在的LLama 3.2 3B模型甚至可以和以前的LLama 70B模型能力相近;除了極少數(shù)頭部公司之外,越來越多的企業(yè)會采用“開源+精調(diào)”來做下一代模型,因此開源架構(gòu)的應(yīng)用會越來越普遍。

“開源模型的優(yōu)勢是生態(tài)和社區(qū),從實際應(yīng)用角度,很多人找個開源模型然后微調(diào)是可以用的,但用開源模型解決所有問題是不夠的。”王鐵震說,“我們將在未來看到越來越多Infra(基礎(chǔ)設(shè)施)和Realtime(實時處理) 的工作,大家不僅需要關(guān)注開源模型本身,還需要重視開源模型的基礎(chǔ)設(shè)施和數(shù)據(jù)閉環(huán),才能把開源模型跑得更好、更快。Realtime 需要TTS(文本到語音),也需要大模型,如果能夠通過一些方式放在一起,放在邊緣側(cè)、離用戶更近的地方,才能產(chǎn)生非常好的效果。”

應(yīng)該如何看到大模型訓(xùn)練和推理的成本問題?曾國洋分享到,“隨著技術(shù)的前進(jìn),算力一定會越來越便宜,相同能力的模型規(guī)模也會越來越小,但算力成本優(yōu)化會最終轉(zhuǎn)化為訓(xùn)練更強大的模型。真正達(dá)到 AGI (通用人工智能)水平之前,我們只能感受到模型在變得越來越強,很難感受到成本的變化。”他還提到,由于面壁智能是做端側(cè)模型的,所以很關(guān)注如何讓模型在端上跑得更快,在實際部署過程中,他們會用各種量化壓縮甚至是稀疏化方法去優(yōu)化實際部署的開銷。

賈揚清也指出成本不是一個考量因素。他判斷,推理成本一年內(nèi)會降到現(xiàn)在的十分之一,創(chuàng)業(yè)者在構(gòu)建應(yīng)用時可以按照做一個應(yīng)用成本是目前十分之一來進(jìn)行成本核算,看能不能做,包括模型、硬件和應(yīng)用在上量后,也都是可以降低成本的。

近期有報道稱,OpenAI正在解散其聚集于AI安全研究的“AGI Readiness”團(tuán)隊。在場的AI企業(yè)創(chuàng)始人是如何看待AI安全和倫理問題的?賈揚清舉例稱,目前的飛機有很多安全需求,但造火箭就被給予了更多靈活性。所以他猜測,OpenAI可能是為了更好地先期發(fā)展,也可能是覺得AI安全沒有跳出傳統(tǒng)的安全范疇,傳統(tǒng)的數(shù)據(jù)安全、云安全已經(jīng)足夠保障了。

王鐵震表示,現(xiàn)在擔(dān)心AI取代人類是比較早的,但是AI已經(jīng)對一些行業(yè)產(chǎn)生了不好影響,比如視頻以假亂真的影響,包括對青少年心理的影響,而這里創(chuàng)業(yè)的機會也是非常多的。

活動現(xiàn)場,聲網(wǎng)宣布與MiniMax正在打磨中國第一個Realtime API (實時處理應(yīng)用程序接口)。那么,應(yīng)該如何看待音視頻多模態(tài)模型的實際應(yīng)用潛力?魏偉表示,隨著多模態(tài)的出現(xiàn),生成式人工智能的邊界一定會被繼續(xù)拓展,并加速這一產(chǎn)業(yè)的變革。從產(chǎn)品和用戶服務(wù)過程中魏偉發(fā)現(xiàn),文本、語音、音樂、視頻這些模型可以很好地幫助藝術(shù)、影視、音樂等領(lǐng)域的創(chuàng)作者極大地提高效率,并為他們提供新的思路和方法。

王鐵震也認(rèn)為,如果視頻生成的效果,能超過電影級別的效果,而且不需要多次生成,哪怕價格高,也有人愿意嘗試。

校對 劉軍

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港