當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人物報(bào)道 > 李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-31 18:40:42 瀏覽：86次

導(dǎo)讀：劃重點(diǎn)01李開(kāi)復(fù)旗下零一萬(wàn)物推出最新旗艦?zāi)Ｐ蚘i-Lightning，性能超越GPT-4o-2024-05-13，位居UC伯克利大模型競(jìng)技場(chǎng)總榜第6。02Yi-Lightning每百萬(wàn)token的價(jià)格僅為0.99元人民幣，不到GPT-4o的3%，降低了近2/3。03李開(kāi)復(fù)認(rèn)為，中國(guó)大模型創(chuàng)業(yè)公司應(yīng)換一種打法，尋找獨(dú)特的“多快好省”的打法后發(fā)制人。04除此之外，他認(rèn)為衡量模型能力很重要，應(yīng)關(guān)注模型與用戶(hù)之間的互動(dòng)和認(rèn)可程 ......

劃重點(diǎn)

01李開(kāi)復(fù)旗下零一萬(wàn)物推出最新旗艦?zāi)Ｐ蚘i-Lightning，性能超越GPT-4o-2024-05-13，位居UC伯克利大模型競(jìng)技場(chǎng)總榜第6。

02Yi-Lightning每百萬(wàn)token的價(jià)格僅為0.99元人民幣，不到GPT-4o的3%，降低了近2/3。

03李開(kāi)復(fù)認(rèn)為，中國(guó)大模型創(chuàng)業(yè)公司應(yīng)換一種打法，尋找獨(dú)特的“多快好省”的打法后發(fā)制人。

04除此之外，他認(rèn)為衡量模型能力很重要，應(yīng)關(guān)注模型與用戶(hù)之間的互動(dòng)和認(rèn)可程度。

05目前，國(guó)內(nèi)已進(jìn)入AI應(yīng)用商業(yè)化拐點(diǎn)，李開(kāi)復(fù)對(duì)ToC和ToB領(lǐng)域的應(yīng)用發(fā)展表示樂(lè)觀。

以上內(nèi)容由大模型生成，僅供參考

GenAI 發(fā)自凹非寺

量子位 | 公眾號(hào) QbitAI

我們只落后OpenAI 5-6個(gè)月，但要進(jìn)一步縮短這個(gè)時(shí)間差，大家的難度都很大。

國(guó)產(chǎn)大模型首次在國(guó)際最具挑戰(zhàn)的“大模型競(jìng)技場(chǎng)”榜單上超過(guò)GPT-4o（5月版本），當(dāng)零一萬(wàn)物的名字緊跟在OpenAI、Google之后，李開(kāi)復(fù)卻如是坦言。

就在“大模型六小強(qiáng)”叫停預(yù)訓(xùn)練的傳聞甚囂塵上之時(shí)，李開(kāi)復(fù)旗下零一萬(wàn)物歷時(shí)5月憋了個(gè)大招，用實(shí)際行動(dòng)回應(yīng)一切：

推出最新旗艦?zāi)Ｐ?strong>Yi-Lightning，性能超越GPT-4o-2024-05-13，沖上UC伯克利大模型競(jìng)技場(chǎng)（Chatbot Arena）總榜第6。

還把每百萬(wàn)token的價(jià)格打到了0.99元人民幣不到該版本GPT-4o的3%，相比于GPT-4o-mini百萬(wàn)token輸入輸出價(jià)格的均值，也降低了近2/3。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

△以上數(shù)據(jù)截止10月26日

不僅大模型競(jìng)技場(chǎng)官方發(fā)帖盛贊，“這標(biāo)志著中國(guó)大模型的強(qiáng)勁增長(zhǎng)”。

也得到了大模型社區(qū)的廣泛認(rèn)可：

中國(guó)大模型正在迎頭趕上！很高興看到競(jìng)爭(zhēng)仍在繼續(xù)，這迫使谷歌和OpenAI等大公司繼續(xù)開(kāi)發(fā)他們的模型，更重要的是，發(fā)布這些模型。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

而這樣一個(gè)模型背后，另一點(diǎn)值得關(guān)注的是，李開(kāi)復(fù)博士和他旗下的零一萬(wàn)物，對(duì)中國(guó)大模型創(chuàng)業(yè)公司的發(fā)展路徑，又有了更清晰的認(rèn)知。

就在與量子位的一對(duì)一對(duì)談中，從打榜，到追趕OpenAI，再到大模型應(yīng)用的商用落地，李開(kāi)復(fù)博士坦誠(chéng)暢聊一切，還與我們分享了來(lái)自硅谷的最新見(jiàn)聞。

具體細(xì)節(jié)，在此分享。

（以下為李開(kāi)復(fù)觀點(diǎn)呈現(xiàn)）

中國(guó)大模型創(chuàng)業(yè)公司要“換一種打法”5-6個(gè)月的差距如何追趕

零一萬(wàn)物從去年11月提出Yi-34B，到今年5月的Yi-Large，再到現(xiàn)在10月的Yi-Lightning，大約是5-6個(gè)月出一個(gè)模型，每次的新模型基本都能夠達(dá)到5-6個(gè)月之前世界第一的水平。

5-6個(gè)月代表著一個(gè)絕對(duì)的差距嗎？

我覺(jué)得追趕有兩種心態(tài)，一種心態(tài)是我要用一樣的方法論去做一樣的事情，消耗一樣的資源往AGI去沖。如果是這種思路，那放棄追趕是正確的。

OpenAI在訓(xùn)練GPT-4的時(shí)候花了1億美金，GPT-5花了10億美金，GPT-6可能就要花100億美金，越往下越是一個(gè)天文數(shù)字。國(guó)內(nèi)沒(méi)有一個(gè)創(chuàng)業(yè)公司能融這么多錢(qián)，大廠可能也不舍得花這么多錢(qián)。

我們必須要有一個(gè)認(rèn)知：美國(guó)有一些投資人的心態(tài)是很獨(dú)特的，無(wú)論三年內(nèi)燒出AGI的概率有多低，都要去砸一下試試。像OpenAI，有非常好的口才能說(shuō)服一批投資人投他們；像馬斯克，他的名字可能就值幾十億美元；像Google，不甘心他們最先發(fā)明的技術(shù)風(fēng)頭被別人搶走，所以咬咬牙也會(huì)投入；Meta我覺(jué)得一定程度是在攪局，但反正他們最近的廣告收益很高，花個(gè)10億美金甚至100億美金沒(méi)什么問(wèn)題。

我們是沒(méi)有這樣的巨量資源的。

所以一模一樣的打法是難以復(fù)制到初創(chuàng)企業(yè)身上的。但我們可以換一種打法，就是找到獨(dú)特的“多快好省”的打法后發(fā)制人，用最少的資源，訓(xùn)練出力所能及的最優(yōu)秀的模型。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

我們說(shuō)只落后OpenAI 5-6個(gè)月，如果說(shuō)要再進(jìn)一步縮短這個(gè)時(shí)間差，包括我們?cè)趦?nèi)的中國(guó)同行們，難度都很大。零一萬(wàn)物的想法是，我們要做一個(gè)世界一流的模型，現(xiàn)階段的策略會(huì)晚于第一個(gè)做到的模型5-6個(gè)月，不過(guò)我們會(huì)爭(zhēng)取做得比它成本更低、速度更快這樣可用性反而是更高的。

中國(guó)公司很擅長(zhǎng)把一件事情做到極致，用更低的成本，實(shí)現(xiàn)更高的效率。成本低了能夠帶來(lái)更多應(yīng)用的爆發(fā)。

衡量模型能力很重要

我認(rèn)為不能衡量的事情就沒(méi)法進(jìn)步，所以打榜不是為了像高考一樣看能得第幾名，而是去了解你在全球這么多厲害的公司和人當(dāng)中，處在什么樣的位置，是不是還有資格繼續(xù)往前沖，還是已經(jīng)掉隊(duì)了。這一點(diǎn)非常重要。

各種榜單衡量的東西不一樣。比如MMLU衡量的是“天花板”，問(wèn)題是蓋一個(gè)天花板100米高的房子，而你最高只能跳幾米，上面的80米完全跳不上去，那有什么意思？

所以我們更看重如何去衡量模型的能力，以及是否被用戶(hù)認(rèn)可。UC伯克利大模型競(jìng)技場(chǎng)的評(píng)估方式，是讓人來(lái)公平地評(píng)價(jià)，這是我們和全球巨頭一直關(guān)注這個(gè)榜單的原因。

我們認(rèn)可的不是打榜、刷榜的概念，而是用一個(gè)公平的，可以和最終用戶(hù)對(duì)接、讓他們來(lái)評(píng)分的這樣一個(gè)方法，來(lái)給我們反饋。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

舉個(gè)例子，這次榜單上我們提交了兩個(gè)模型，看它們不同的得分，我們就能學(xué)到很多東西。

我們?cè)谶@個(gè)榜單上是全球范圍排第三名的公司，只在OpenAI和Google之后。讓我們很欣慰的是我們知道自己肯定處在世界第一梯隊(duì)上，這一點(diǎn)對(duì)我們來(lái)說(shuō)非常重要，讓團(tuán)隊(duì)非常振奮，因?yàn)槲覀冎雷约旱哪Ｐ褪强梢源驀?guó)內(nèi)、國(guó)外市場(chǎng)的，誰(shuí)都不用怕。

這對(duì)我們團(tuán)隊(duì)來(lái)說(shuō)是一個(gè)正反饋，讓我們有信心往前沖，繼續(xù)做模型，繼續(xù)做預(yù)訓(xùn)練。

另外很重要的是，跟排我們前面五名和后面五名的模型相比，Yi-Lightning的速度都比它們快。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

AI應(yīng)用進(jìn)入商業(yè)化拐點(diǎn)現(xiàn)在國(guó)內(nèi)進(jìn)入了一個(gè)可以做AI應(yīng)用的時(shí)間點(diǎn)。

為什么早前AI應(yīng)用比較難做呢？其實(shí)就一個(gè)原因：好的模型推理成本太高。一年半前，中國(guó)就沒(méi)有一個(gè)模型是可以做出PMF（產(chǎn)品市場(chǎng)匹配）來(lái)的。

過(guò)去做移動(dòng)應(yīng)用，用戶(hù)從10萬(wàn)增長(zhǎng)到100萬(wàn)，雖然也會(huì)增加帶寬、服務(wù)器等成本，但公司們不會(huì)因此破產(chǎn)。而在AI時(shí)代，如果一次推理就要幾塊錢(qián)，當(dāng)用戶(hù)10倍增長(zhǎng)時(shí)，創(chuàng)業(yè)公司們馬上就會(huì)破產(chǎn)。

今年，國(guó)內(nèi)達(dá)到世界一流水平的模型已經(jīng)有幾個(gè)了，并且有些成本已經(jīng)足夠低。比如我們的Yi-Lightning，每百萬(wàn)token的價(jià)格是0.99元人民幣，就已經(jīng)可以支持一個(gè)AI搜索應(yīng)用：每次搜索成本只要1-2分錢(qián)，即使用戶(hù)達(dá)到百萬(wàn)級(jí)別，每人每天搜5次，成本也還是可控的。

這就是為什么要等到有一個(gè)性?xún)r(jià)比足夠高的世界級(jí)模型，才能像移動(dòng)互聯(lián)網(wǎng)時(shí)代那樣去做應(yīng)用的原因。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

國(guó)內(nèi)ToC的應(yīng)用目前還沒(méi)有出現(xiàn)一個(gè)Super APP，不是因?yàn)橛脩?hù)不需要，而是因?yàn)橹白銐蚝玫哪Ｐ蜁?huì)把任何一個(gè)創(chuàng)業(yè)者燒破產(chǎn)。到今天好的模型足夠便宜，情況就大大改變了，對(duì)ToC我是非常樂(lè)觀的。并且我相信，中國(guó)的創(chuàng)業(yè)者在做PMF方面是超過(guò)美國(guó)的，就好像美團(tuán)做得比DoorDash好，抖音做得比Instagram好一樣。

不過(guò)做應(yīng)用可能還有一個(gè)挑戰(zhàn)，就是用戶(hù)的獲取成本。

國(guó)內(nèi)大廠很強(qiáng)勢(shì)，創(chuàng)業(yè)公司獲取用戶(hù)的成本會(huì)比較高。所以對(duì)創(chuàng)業(yè)者來(lái)說(shuō)，除了要有信心，模型夠好夠便宜，下一個(gè)就是怎么去找到機(jī)會(huì)，用比較少的錢(qián)撬動(dòng)比較多的流量，或者是解決用戶(hù)的強(qiáng)需求。

對(duì)于ToB的應(yīng)用，我覺(jué)得本質(zhì)是大模型代表的AI 2.0時(shí)代跟AI 1.0時(shí)代是有差別的。AI 1.0是項(xiàng)目制，你要做什么我全部幫你進(jìn)場(chǎng)去做，做一單賠一單。在今天很多ToB的公司還是做一單賠一單，這個(gè)是讓人擔(dān)憂(yōu)的。

但比較樂(lè)觀的是，當(dāng)你擁有大模型的能力，項(xiàng)目可以更便宜地做出來(lái)。有大模型的底座，不用收集那么多數(shù)據(jù)，它本身的能力就已經(jīng)很強(qiáng)了。

大模型還有很多過(guò)去未有的能力，無(wú)論是做Agent、多模態(tài)內(nèi)容生成，還是做Copilot、直播，這些能力都是AI 1.0時(shí)代沒(méi)有的，是值得一試的。

走ToB路線(xiàn)特別要當(dāng)心的是，首先，不要做一單賠一單。

其次，要認(rèn)識(shí)到客戶(hù)對(duì)模型沒(méi)有需求，對(duì)解決方案才有需求。

第三，應(yīng)該努力去找到合適的行業(yè)，能夠快速讓模型的本質(zhì)融合行業(yè)的特質(zhì)，實(shí)現(xiàn)省錢(qián)或者賺錢(qián)，最好是賺錢(qián)。

對(duì)于零一萬(wàn)物來(lái)說(shuō)，我們會(huì)逐漸釋放我們的產(chǎn)品。在ToC方面，我們還是會(huì)延續(xù)國(guó)外先嘗試，再回到國(guó)內(nèi)市場(chǎng)的路線(xiàn)。主要是我們已經(jīng)在海外建立了一些實(shí)操經(jīng)驗(yàn)，積累了一些對(duì)海外市場(chǎng)的理解，而且有些應(yīng)用在海外收費(fèi)比較容易被用戶(hù)接受。

ToB的話(huà)我們?cè)诹闶�、政�?wù)、金融、能源等領(lǐng)域做出了一些有利潤(rùn)的單子。但是坦誠(chéng)地說(shuō)也還在不斷驗(yàn)證，如何去建立可持續(xù)的優(yōu)勢(shì)。

當(dāng)你在某個(gè)行業(yè)里拿下一單，它是一個(gè)不可復(fù)制的特例，還是可以重復(fù)再做第二單、第三單？在第二單、第三單中技術(shù)的重復(fù)使用能不能讓你的利潤(rùn)率變得更高？這都還需要驗(yàn)證。我們的第二年，會(huì)聚焦在從技術(shù)到應(yīng)用實(shí)踐的商業(yè)化驗(yàn)證。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

什么應(yīng)用是值得去做的？2009年我做過(guò)一次演講，當(dāng)時(shí)說(shuō)到移動(dòng)互聯(lián)網(wǎng)的應(yīng)用到來(lái)的順序會(huì)和PC應(yīng)用成長(zhǎng)的順序相關(guān)。比如先是讀取內(nèi)容、撰寫(xiě)內(nèi)容，然后是搜索管理內(nèi)容，再能夠去把內(nèi)容做得更加多元化、更豐富，之后能夠在內(nèi)容之外拓展付費(fèi)行為，包括廣告、支付、電商、社交等等。內(nèi)在邏輯是人的需求其實(shí)就是這些。

一個(gè)新的時(shí)代到來(lái)，應(yīng)該也是這樣的。AI內(nèi)容的閱讀和生產(chǎn)，是ChatGPT、Midjourney、可靈。那下一個(gè)階段就是AI搜索，然后是多模態(tài)社交/娛樂(lè)，再走到本地生活&電商等等。

健康的大模型生態(tài)是倒三角結(jié)構(gòu)“ChatGPT火爆之后，錢(qián)都讓英偉達(dá)賺走了”，這個(gè)觀點(diǎn)是一個(gè)客觀的事實(shí)。

一個(gè)主要因素是英偉達(dá)的主要客戶(hù)是超級(jí)大廠，他們一買(mǎi)就買(mǎi)十萬(wàn)張、幾十萬(wàn)張卡，這一下就讓英偉達(dá)賺了很多錢(qián)。

這些公司的想法是要成為第一個(gè)做出AGI的公司，所以花多少錢(qián)買(mǎi)GPU都是值得的。這個(gè)心態(tài)就會(huì)導(dǎo)致錢(qián)都流向英偉達(dá)，也可能導(dǎo)致他們做出來(lái)的模型很厲害，但都很大、很昂貴。

對(duì)于我們來(lái)說(shuō)其中的機(jī)會(huì)就是做更小的、推理成本更低的模型，去推動(dòng)應(yīng)用的發(fā)展。

要突破這個(gè)現(xiàn)狀，我覺(jué)得就是要有足夠多的公司了解到這樣一個(gè)生態(tài)系統(tǒng)：

底層是GPU，中間是各種模型平臺(tái)，模型平臺(tái)之上是應(yīng)用。這個(gè)結(jié)構(gòu)一定要是上層最大、底層最小的倒三角，才是健康的。

另一個(gè)因素是，英偉達(dá)實(shí)在太強(qiáng)了，利潤(rùn)非常高。如果有兩三家芯片廠商能與之競(jìng)爭(zhēng)，他們的整個(gè)盤(pán)子可能就沒(méi)有那么大，我們買(mǎi)到的GPU也可能變得更便宜。但短期來(lái)看，英偉達(dá)還是業(yè)界最強(qiáng)。

硅谷新見(jiàn)聞o1引入了一個(gè)非常新的思維方式：不是所有智能都來(lái)自于預(yù)訓(xùn)練和微調(diào)。

以后大模型技術(shù)的發(fā)展應(yīng)該會(huì)有三條路線(xiàn)：

第一還是怎么做好預(yù)訓(xùn)練；

第二是怎么做好post-training；

第三是怎么在推理之中加入思考。

o1最讓我驚訝的是，我在美國(guó)碰到一位經(jīng)濟(jì)學(xué)教授，他跟我說(shuō)，他用o1等于能少招一個(gè)博士生。

他有什么想法不用等到博士生每周跟他1 on 1的時(shí)候再來(lái)討論，而是可以隨時(shí)打開(kāi)電腦去問(wèn)o1。雖然有時(shí)候會(huì)有錯(cuò)誤，但教授給它指出后，o1居然會(huì)學(xué)習(xí)，有時(shí)候還能反過(guò)來(lái)糾老師的錯(cuò)。所以這件事就變成，o1可能比一個(gè)博士生還能增強(qiáng)老師的能力。

當(dāng)時(shí)我跟他聊的時(shí)候還有OpenAI的人在旁邊。OpenAI的人就很興奮地加入進(jìn)來(lái)問(wèn)，教授你愿意花多少錢(qián)買(mǎi)o1的服務(wù)？教授說(shuō)很簡(jiǎn)單，我招博士生一年是10萬(wàn)美元，那我愿意付這10萬(wàn)美元給o1。

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難

另外一件大家都在討論的事是OpenAI的融資。

OpenAI的這次融資有點(diǎn)辛苦，融到66億美元，看起來(lái)很多了，但要考慮到OpenAI的估值是1570億美元。

挑戰(zhàn)來(lái)自于哪里？我的理解是GPT-5是不太好訓(xùn)練的。理論上GPT-5應(yīng)該已經(jīng)出來(lái)了，但現(xiàn)在推延了，會(huì)推延多久大家并不知道。

但OpenAI可怕的地方在于，他們內(nèi)部藏了很多類(lèi)似o1這樣的項(xiàng)目。他們并不著急推出，第一是怕競(jìng)爭(zhēng)對(duì)手會(huì)學(xué)習(xí)進(jìn)步，第二是要等到融資的節(jié)點(diǎn)，回應(yīng)競(jìng)爭(zhēng)對(duì)手的節(jié)點(diǎn)再拿出來(lái)用。

可以觀察到的是，一年前，投資人們還在瘋狂投各種模型，到今年，大家已經(jīng)意識(shí)到，從純財(cái)務(wù)投資的角度來(lái)講，花很多錢(qián)去訓(xùn)練一個(gè)并沒(méi)有產(chǎn)生太大商業(yè)價(jià)值的模型，幾個(gè)月以后它就可能被取代，錢(qián)就白燒了。

我講這個(gè)事情最主要的一點(diǎn)是想說(shuō)：

投資人已經(jīng)開(kāi)始用商業(yè)思維來(lái)評(píng)估這個(gè)領(lǐng)域了。

完

相關(guān)熱詞： openai 李開(kāi)復(fù) 大模型競(jìng)技場(chǎng) google 模型

上一篇：知乎直答上線(xiàn)專(zhuān)業(yè)搜索：首個(gè)AI搜索、正版論文庫(kù)一站式解決方案

下一篇：o1推理將用于圖像理解，OpenAI在倫敦捅了開(kāi)發(fā)者窩

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-31 18:40:42 瀏覽：86次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門(mén)排行

推薦內(nèi)容

在線(xiàn)客服

熱門(mén)欄目HotCates

關(guān)于我們

版權(quán)聲明

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-31 18:40:42 瀏覽：86次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門(mén)排行

推薦內(nèi)容

在線(xiàn)客服

熱門(mén)欄目HotCates

關(guān)于我們

版權(quán)聲明

李開(kāi)復(fù)回應(yīng)一切：我們只落后OpenAI 5-6個(gè)月，但縮短時(shí)間差很難
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-31 18:40:42 瀏覽：86次