展會信息港展會大全

李開復(fù)辟謠「掉隊(duì)」傳聞,零一萬物推「白菜價(jià)」頂級模型
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-10-21 12:28:56   瀏覽:2318次  

導(dǎo)讀:劃重點(diǎn) 01零一萬物發(fā)布新旗艦?zāi)P蚘i-Lightning,在國際權(quán)威盲測榜單LMSYS上超越OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。 02創(chuàng)始人李開復(fù)表示,Yi-Lightning是「頂級模型白菜價(jià)」,成本線上加一點(diǎn)點(diǎn)小小的利潤,每...

劃重點(diǎn)

01零一萬物發(fā)布新旗艦?zāi)P蚘i-Lightning,在國際權(quán)威盲測榜單LMSYS上超越OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。

02創(chuàng)始人李開復(fù)表示,Yi-Lightning是「頂級模型白菜價(jià)」,成本線上加一點(diǎn)點(diǎn)小小的利潤,每百萬token僅需0.99元。

03除此之外,零一萬物首度公布全新ToB戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人,聚焦零售和電商等場景。

04李開復(fù)認(rèn)為,逐步放棄模型預(yù)訓(xùn)練可能會成為行業(yè)整體趨勢,但中國的六家大模型公司只要有夠好的人才和融資額,做預(yù)訓(xùn)練的決心,應(yīng)該沒有問題。

以上內(nèi)容由騰訊混元大模型生成,僅供參考

大模型發(fā)展到現(xiàn)在,我們應(yīng)該關(guān)注什么?

像 OpenAI o1 這樣的技術(shù)新范式是其一;像 canvas、NotebookLM 這樣的產(chǎn)品新思路也是;還包括用戶、客戶營收這樣的商業(yè)化指標(biāo)。

目標(biāo)多元,但資源有限。

進(jìn)入 10 月,國內(nèi)的大模型創(chuàng)業(yè)公司「六小虎」(月之暗面、Minimax、百川智能、智譜 AI、零一萬物、階躍星辰)開始在不同的道路上做出選擇。

Minimax 被傳年?duì)I收預(yù)計(jì) 7000 萬美金,同一時(shí)間流出的信息,還包括海螺 AI 由于視頻大模型的推出訪問量激增;

智譜清言 AI 搜索、月之暗面 Kimi 探索版,則相繼推出了主打具備深度推理能力的 AI 搜索;

百川智能和階躍星辰尚未釋放進(jìn)一步動作;

零一萬物選擇公布了最新模型進(jìn)展,力破停止預(yù)訓(xùn)練等傳言。

10 月 16 日,繼千億參數(shù)模型 Yi-Large 之后,零一萬物正式對外發(fā)布新旗艦?zāi)P?Yi-Lightning,在國際權(quán)威盲測榜單 LMSYS 上,Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。

李開復(fù)辟謠「掉隊(duì)」傳聞,零一萬物推「白菜價(jià)」頂級模型

在國際權(quán)威盲測榜單 LMSYS 上,Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中國第一。|圖片來源:零一萬物

對此,零一萬物創(chuàng)始人李開復(fù)稱 Yi-Lightning 是「頂級模型白菜價(jià)」,這是當(dāng)前 AI 領(lǐng)域最需要的。他表示,「Yi-Lightning 和馬斯克的 xAI Grok 打平,并列第六名;同時(shí)也是全球第三的中國大模型企業(yè),排在零一萬物之前的模型基本只有 OpenAI 和 Google」,這是中國大模型首度實(shí)現(xiàn)的最佳成績。在推理速度和價(jià)格上,Yi-Lightning 的最高生成速度提速近四成,每百萬 token 僅需 0.99 元,且該定價(jià)仍有利潤。

李開復(fù)透露,這次預(yù)訓(xùn)練只用 2000 張 GPU 訓(xùn)練一個(gè)半月,只花了 300 多萬美金,做出來的預(yù)訓(xùn)練模型跟 Grok 打平,只花它的 1% 或 2% 的成本。

進(jìn)入 2024 年,鮮少有發(fā)布會只展示模型能力本身,AI 落地的產(chǎn)品、場景、客戶案例等都成為外界關(guān)注的重點(diǎn)。會上,零一萬物也首度公布了全新 ToB 戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品 AI 2.0 數(shù)字人,聚焦零售和電商等場景。

對于 ToC 產(chǎn)品及海外進(jìn)展,本次發(fā)布會上未作披露。今年 5 月 Yi-Large 的發(fā)布會上,零一萬物預(yù)計(jì)今年?duì)I收預(yù)計(jì)可達(dá) 1 億人民幣。

李開復(fù)辟謠「掉隊(duì)」傳聞,零一萬物推「白菜價(jià)」頂級模型

李開復(fù)在朋友圈辟謠|圖片來源:網(wǎng)絡(luò)

早在 5 天前,李開復(fù)已在朋友圈回應(yīng)了停止預(yù)訓(xùn)練的傳言,并在知乎上談到了他對大模型接下來將如何洗牌的思考。今天 Yi-Lightning 的發(fā)布進(jìn)一步回?fù)袅藗餮,李開復(fù)也進(jìn)一步聊到了當(dāng)前大模型競賽中的幾大爭議。以下是他的思考,經(jīng)極客公園整理:

01 六小虎分野之 01 萬物的牌面:「頂級模型白菜價(jià)」

問:模型做到「世界第六,中國第一」,同時(shí)以較低的價(jià)格推向市場,如何實(shí)現(xiàn)的?

李開復(fù):零一萬物在 Yi-Lightning 的定價(jià)上并沒有虧本。

成立第一天起,零一萬物同時(shí)啟動了模型訓(xùn)練、AI Infra、AI 應(yīng)用三大團(tuán)隊(duì),三個(gè)團(tuán)隊(duì)成熟后,再對接到一起。零一萬物將這一模式總結(jié)為;步、模應(yīng)一體兩大戰(zhàn)略。AI Infra 助力模型訓(xùn)練和推理,以更低的訓(xùn)練成本,訓(xùn)練出性能領(lǐng)先的模型,以更低的推理成本支撐應(yīng)用層的探索。

我們不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點(diǎn)點(diǎn)小小的利潤,就得到了今天 0.99 元/百萬 token 的價(jià)格。

挑選模型 API 最重要的一點(diǎn),是模型性能一定要優(yōu)秀,在這個(gè)前提之下才去挑最便宜的,我相信,綜合 Yi-Lightning 的模型質(zhì)量和價(jià)格來看,Yi-Lightning 很可能是很多開發(fā)者最認(rèn)可、最高性價(jià)比的模型。

問:零一萬物首次公布 ToB 相關(guān)矩陣,未來會進(jìn)一步在 ToB 方向深耕嗎?

李開復(fù):在國內(nèi),大模型 ToB 相對于 AI 1.0 時(shí)代有不同的打法,首要任務(wù)就是要尋找少數(shù)能夠按使用情況收費(fèi)的方法,而不是項(xiàng)目定制的方法。能得到比較高利潤率的訂單再去做。

今天零一萬物推出的 AI 2.0 數(shù)字人解決方案不是做一單賠一單的做法,它專注到用戶重大的痛點(diǎn)需求和盈利點(diǎn),也就是一個(gè)店長或 KOL 平時(shí)做一次直播浪費(fèi)最重要的資源他的時(shí)間。這個(gè)時(shí)間就算做一小時(shí)直播能賺到一千塊錢,也就是這一千塊錢,但如果用數(shù)字人直播就不是一小時(shí)了,可能可以做一千個(gè)小時(shí)(直播),哪怕每一個(gè)小時(shí)只能賺一半的錢,一千個(gè)小時(shí)還是可以賺五百倍的錢,這樣賬就很好算了。

如果真的能把數(shù)字人做到端到端,只要輸入公司內(nèi)部的東西,選一個(gè)形象、聲音按一個(gè)鈕就開始直播,等于賣給這個(gè)企業(yè)一個(gè)印鈔機(jī),印鈔機(jī)要收租賃費(fèi)就可行。除了直播以外,我們的 AI 2.0 數(shù)字人解決方案已經(jīng)跑通了更多業(yè)務(wù)場景,比如 AI 伴侶、IP 形象、辦公會議等等。

整體來看,零一萬物 ToB 整體解決方案會采雀一橫一縱」的打法。先將單個(gè)行業(yè)做深做透,進(jìn)而以自身技術(shù)能力和行業(yè)積累為基礎(chǔ),凝練出標(biāo)準(zhǔn)化的 ToB 解決方案,為各行各業(yè)的企業(yè)客戶將本提效。

問:除了數(shù)字人解決方案,零一萬物是否還有其他 ToB 解決方案?

李開復(fù):除了我們已經(jīng)發(fā)布的 AI 2.0 數(shù)字人、API 之外,零一萬物目前還有 AI Infra 解決方案、私有化定制模型等其他 ToB 業(yè)務(wù),我們會在近期正式對外發(fā)布,敬請期待。

問:零一萬物在海外推出 ToC 產(chǎn)品,國內(nèi)陸續(xù)推出 ToB 產(chǎn)品,當(dāng)前在 B 端、C 端的產(chǎn)品現(xiàn)狀如何?

李開復(fù):一個(gè)大模型公司同時(shí)做 ToB 和 ToC 很辛苦,銷售方法、利潤的比例、需要多少投放才會有收入等評估體系完全不同。也需要多元化的管理方式,因?yàn)閮蓚(gè)團(tuán)隊(duì)的基因不一樣,做事的方法、衡量 KPI 的方法都不太一樣。我在這兩個(gè)領(lǐng)域有經(jīng)驗(yàn),也在試著做,但也絕對不能什么都做。

ToB 上,零一選擇做國內(nèi)市場,是因?yàn)檎业搅艘恍┢凭值目臻g,比如用數(shù)字人來做零售、餐飲等,能做一個(gè)完整的解決方案。另外還有兩三個(gè)領(lǐng)域開始在做,現(xiàn)在還不方便披露。ToB 不做海外市場,是因?yàn)槿澜绲姆懂犂,ToB 供應(yīng)商基本都是當(dāng)?shù)氐摹_x擇在國內(nèi)做 ToB,還要選擇有利潤的解決方案做,而不只是賣模型、不只是做項(xiàng)目制,這是我們 ToB 的做法。

ToC 我們主要布局海外。當(dāng)我們開始做零一萬物時(shí),國內(nèi)還沒有合適的中文模型,只有在國外先嘗試,迭代了一個(gè)、兩個(gè)、三個(gè)產(chǎn)品,這些產(chǎn)品現(xiàn)在表現(xiàn)有些很好,有些沒有那么好,在不斷地調(diào)整中。

我們也在觀察什么時(shí)候適合在國內(nèi)市場做什么樣的產(chǎn)品,目前做 ToC 產(chǎn)品面臨一個(gè)很大的問題流量成本越來越高。我們也看到有些友商的用戶從十幾塊人民幣加到三十多塊人民幣,近來還有相當(dāng)?shù)牧魇В?/strong>在這樣一個(gè)環(huán)境里,我們會非常謹(jǐn)慎,先不推出中國本土新的 ToC 應(yīng)用,同時(shí)已有的產(chǎn)品還會繼續(xù)維護(hù),但更多的精力會在海外的土壤用更低的成本買到非常高質(zhì)量的用戶,或者能直接把 App 賣出去,讓用戶來訂閱收費(fèi),那邊訂閱習(xí)慣相對成熟。

換句話說,現(xiàn)在現(xiàn)狀選擇在海外做 ToC 產(chǎn)品,變現(xiàn)能力和消耗用戶增長的成本算賬可以算得過來,以后再關(guān)注國內(nèi)有什么機(jī)會可以推出。

02一輪預(yù)訓(xùn)練已降至 300 萬美金,「六小虎」都可以 cover

問:此前有消息稱 AI 方面的六小虎,某幾家放棄了預(yù)訓(xùn)練。站在行業(yè)的角度,逐步放棄模型預(yù)訓(xùn)練會成為行業(yè)整體趨勢嗎?

李開復(fù):做好預(yù)訓(xùn)練模型是一個(gè)技術(shù)活,而且要非常多有才華的人在一起工作,慢工出細(xì)活。需要有懂芯片的人、懂推理的人、懂基礎(chǔ)架構(gòu)的人、懂模型的人、很好的算法同學(xué),一起做出來。

如果一個(gè)公司能有幸擁有這么多優(yōu)秀的人才,能夠跨領(lǐng)域的合作,我相信中國絕對可以做出世界排名前十的預(yù)訓(xùn)練的通用模型,但不是每家公司都可以做這件事情,做這件事情的成本也比較高,以后有可能會越來越少的大模型公司做預(yù)訓(xùn)練。

不過據(jù)我所知,這六家公司融資額度都是夠的,我們做預(yù)訓(xùn)練的 production run,訓(xùn)練一次三四百萬美金,這個(gè)錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才,想做預(yù)訓(xùn)練的決心,融資額跟芯片都不會是問題的。

03 AGI 的上限:o1 開啟推理層面的新范式,OpenAI 還藏著技術(shù)

問:今年 5 月份,Yi-Large 把中美頂尖模型的時(shí)間差縮短到六個(gè)月,這次 Yi-Lightning 發(fā)布直接擊敗了 GPT-4o,把時(shí)間差甚至縮短到了五個(gè)月,零一萬物如何能繼續(xù)追趕縮短這個(gè)時(shí)間差?

李開復(fù):縮短時(shí)間差非常困難,我不預(yù)測我們可以縮短這個(gè)時(shí)間差。因?yàn)楫吘谷思沂怯檬f張 GPU 訓(xùn)練出來,我們用的是兩千張 GPU 訓(xùn)練出來。

Yi-Lightning 的效果是因?yàn)閳F(tuán)隊(duì)和社區(qū)大家都熱心聰明去使用,去理解對方做出來的東西,再加上我們自己每家的研發(fā)有特色,比如數(shù)據(jù)處理、訓(xùn)推優(yōu)化等等,現(xiàn)在這一套方法論在零一萬物已經(jīng)成熟了,我們有信心把自己的創(chuàng)新加上我們的一些特長,在關(guān)注 OpenAI 和其他公司發(fā)布的新技術(shù),盡快地去能夠了解這些技術(shù)的核心重要性,然后把它的能力在我們自己的產(chǎn)品里面發(fā)揮出來。

我覺得這套方法保持在六個(gè)月左右,就已經(jīng)是很好的結(jié)果了。如果期待破局,可能需要一個(gè)前所未有的算法才有機(jī)會。我們千萬不要認(rèn)為落后六個(gè)月是一個(gè)很羞恥的事情,或者一定是要追趕的事情,因?yàn)槲液芏嗪M馀笥讯颊J(rèn)為中國會遠(yuǎn)遠(yuǎn)落后,人家十萬張 GPU 等,我們要被甩掉三年、五年甚至十年都有可能,現(xiàn)在零一萬物證明了不會落后這么多,而且這次 LMSYS 的榜單上也有其他兩家中國公司表現(xiàn)不錯(cuò)。

問:OpenAI 的 o1 發(fā)布后,從技術(shù)上帶來在推理側(cè)的 Scaling 新范式,你怎么看?對初創(chuàng)公司會有哪些影響?

李開復(fù):OpenAI 真的是很厲害的公司,在他們的員工交流時(shí),他們說OpenAI 內(nèi)部還有一些好東西,但是不急拿出來,因?yàn)樗麄冾I(lǐng)先行業(yè)足夠多。這次他們把 o1 拿出來主要是因?yàn)?GPT-5 訓(xùn)練不順利,而他們需要融資,就先把 o1 公開,這是他們能做而別人不能做的。

OpenAI o1 雖然隱藏了所有中間的思考狀態(tài),但是很多人還是在網(wǎng)上開始猜它怎么做,我們認(rèn)為有一些揣測還是比較靠譜,所以當(dāng)你發(fā)了一個(gè)新技術(shù),這個(gè)技術(shù)被很多聰明人使用、揣測,我覺得五個(gè)月以后,應(yīng)該也有不少類似 o1 模型的能力出現(xiàn)在各個(gè)模型公司,包括零一萬物。

o1 的思考模式是把之前只在預(yù)訓(xùn)練中 scaling 的趨勢擴(kuò)展到了推理,這件事情對行業(yè)是最大的認(rèn)知的改變。過去大家覺得誰預(yù)訓(xùn)練做好就夠了,慢慢大家發(fā)現(xiàn)后訓(xùn)練 SFT 和強(qiáng)化訓(xùn)練都是非常重要。

所以零一萬物的團(tuán)隊(duì)剛開始做的主要是專注預(yù)訓(xùn)練,之后又有很多很厲害的人加入,幫我們把后訓(xùn)練也做出來,現(xiàn)在看來推理也很重要,感謝 OpenAI 點(diǎn)醒我們這一點(diǎn),相信現(xiàn)在很多中美公司都在往 o1 方向狂奔。

*頭圖來源:視覺中國

本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO

贊助本站

相關(guān)內(nèi)容
AiLab云推薦

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港