展會信息港展會大全

馬斯克的xAI連發(fā)兩款新模型,有進步但還談不上領(lǐng)先
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-08-15 11:02:38   瀏覽:90805次  

導(dǎo)讀:界面新聞記者 | 陳振芳 界面新聞編輯 | 宋佳楠 Grok的進度是火箭。馬斯克如此興奮地在X上宣布Grok-2的到來。 當?shù)貢r間8月14日,xAI發(fā)布了Grok-2和Grok-2mini兩款A(yù)I模型的測試版。其中,Grok-2是該公司推理能力最強的語言模型,而輕量化模型Grok-2mini則是Gro...

界面新聞記者 | 陳振芳

界面新聞編輯 | 宋佳楠

“Grok的進度是火箭。”馬斯克如此興奮地在X上宣布Grok-2的到來。

當?shù)貢r間8月14日,xAI發(fā)布了Grok-2和Grok-2mini兩款A(yù)I模型的測試版。其中,Grok-2是該公司推理能力最強的語言模型,而輕量化模型Grok-2mini則是Grok-2的“兄弟產(chǎn)品”,試圖實現(xiàn)小參數(shù)體型下的強功能。

xAI在博客文章中表示,Grok-2的早期預(yù)覽版相較于Grok-1.5有了重大進步,具有聊天、編碼和推理方面的前沿功能。

該公司聲稱,Grok-2的早期版本以“sus-column-r”的名稱進行測試,在LMSYS排行榜上的表現(xiàn)優(yōu)于Anthropic公司的Claude 3.5 Sonnet和OpenAI的GPT-4-Turbo。LMSYS排行榜通過在大語言模型間進行隨機匿名的一對一“對戰(zhàn)”,并基于ELO評級系統(tǒng)得出排名。

馬斯克的xAI連發(fā)兩款新模型,有進步但還談不上領(lǐng)先

圖源:xAI

sus-column-r(Grok 2早期版本)現(xiàn)已公開,憑借超過12000個社區(qū)投票,sus-column-r在總體排行榜上獲得了第3名,與GPT-4o相當。它在編碼獲得第2名、困難提示獲得第4名,數(shù)學方面也取得第2名。

xAI還通過AI導(dǎo)師系統(tǒng)測試Grok與新的模型互動表現(xiàn),Grok-2重點評估模型在兩個關(guān)鍵領(lǐng)域的能力:遵循指示和提供準確、真實的信息。Grok-2在推理檢索到的內(nèi)容和工具使用能力方面表現(xiàn)出顯著進步,例如正確識別缺失信息、通過事件序列進行推理以及丟棄不相關(guān)的帖子。

此外,xAI通過一系列學術(shù)基準對Grok-2模型進行了評估,這些基準包括推理、閱讀理解、數(shù)學、科學和編碼。該公司表示,“在研究生水平的科學知識、常識和數(shù)學競賽問題等領(lǐng)域的表現(xiàn)可與其他前沿模型相媲美。”

馬斯克正在將xAI與其收購的社交媒體“X”深度綁定Grok-2和Grok-2mini將對X的增強搜索功能、深入了解帖子以及改進回復(fù)功能提供支持,盡管此前xAI曾因使用X用戶數(shù)據(jù)進行訓練而遭致反對。

此次更新的一大亮點是,Grok-2模型可以在X上生成圖像,其生圖模型使用了近期大火的 Flux.1模型,但目前僅限于X上的Premium和Premium+用戶。

由于Grok的圖像生成功能沒有任何限制,已經(jīng)有不少用戶借此進行政治人物圖像創(chuàng)作,例如有用戶利用Grok-2生成美國首任總統(tǒng)華盛頓的圖片,該帖子還被馬斯克轉(zhuǎn)載。然而,OpenAI的ChatGPT會拒絕生成這類圖像,避免政治風險。

馬斯克的xAI連發(fā)兩款新模型,有進步但還談不上領(lǐng)先

圖源:X

值得注意的是,Grok-2和Grok-2mini目前仍處于測試階段。該公司預(yù)計,本月晚些時候?qū)⑼ㄟ^其企業(yè)API向開發(fā)人員提供這兩種模型。即將推出的API建立在新的定制技術(shù)堆棧上,允許多區(qū)域推理部署,以實現(xiàn)全球低延遲訪問,同時提供增強安全功能,例如強制性多因素身份驗證、流量統(tǒng)計數(shù)據(jù)和高級計費分析。

在與OpenAI分道揚鑣后,馬斯克曾預(yù)測2029年將會實現(xiàn)通用人工智能,而他所創(chuàng)辦的xAI最終目標是讓消費者、企業(yè)甚至所有人都可以使用AI產(chǎn)品,并變成有用的工具。其希望通過AI去幫助人們解決復(fù)雜的科學和數(shù)學問題,并且“理解”宇宙。

xAI的動作也在不斷加速。該公司于2024年1月進行了首次融資,金額為1.35億美元;5月完成了60億美元的B輪融資,公司估值也從此前的180億美元飆升至250億美元,成為美國又一家AI獨角獸。

到了7月,馬斯克表示,xAI團隊已經(jīng)開始在“孟菲斯超級集群”上進行訓練。該集群由10萬個液冷H100 GPU組成,目標是在今年12月前訓練出“按每項指標衡量都是世界上最強大的人工智能”。

他的野心還不止于此,曾透露xAI計劃打造一臺超級計算機“算力的超級工廠”,預(yù)計規(guī)模是市場上最強大競爭對手的四倍。

作為大模型的“后來者”,馬斯克認為xAI可以在人工智能領(lǐng)域帶來新的突破和創(chuàng)新,同時強調(diào)競爭有利于推動整個行業(yè)的進步,避免形成一家公司在人工智能領(lǐng)域占主導(dǎo)地位的單極世界。

但從其最新發(fā)布的兩款模型來看,并未表現(xiàn)出超越行業(yè)的創(chuàng)新性,仍處于追趕者的角色。Grok-2要想在與OpenAI、谷歌等一眾科技公司的競爭中突圍,需拿出更強有力的產(chǎn)品才行。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港