提前過年了。
OpenAI昨天在X上發(fā)推文,說從12月5日開始,要進行為期十二天的發(fā)布會,美國西部時間每天上午十點,每天擠一點點牙膏。
這個配置非常像美國流行的圣誕倒數(shù)日歷,每天開一個小獎,有一個小驚喜,直到節(jié)日來臨。
“12天,12場直播,一堆新玩意兒,有大有小”|還說不是圣誕禮盒!
OpenAI CEO薩姆奧爾特曼(Sam Altman)前幾天也在《紐約時報》DealBook峰會上給活動預(yù)熱。“我們準備了很多新的、很棒的東西,”奧爾特曼說,“在接下來的12個工作日里,我們每天都會發(fā)布一個新功能,或者進行一次演示!
據(jù)媒體透露的信息,這12天的發(fā)表內(nèi)容包括之前大火的文本轉(zhuǎn)視頻AI Sora的升級版,和ChatGPT的agent版(也就是能處理特定任務(wù)的“披皮”ChatGPT),和推理模型o1的完全體。
在此之前,OpenAI好像很久都沒有大動作了,距離Sora的第一次亮相已經(jīng)過去了294天,距離ChatGPT語音版發(fā)布已經(jīng)過去了205天,o1前瞻版的發(fā)布也已經(jīng)是九月的事了。
第一天的內(nèi)容有這些
今天凌晨,我們圍觀了12天發(fā)布會的第一炮。這個發(fā)布會很短,不到二十分鐘就結(jié)束了。
發(fā)布會氣氛很輕松隨意,像家庭聚會,參與者除了奧爾特曼本人,還包括科學家 Hyung Won Chung(左二),他是o1模型的核心作者,在MIT取得了能源方向的博士學位,目前是OpenAI的研究科學家。右二和右一分別是Max Schwarzer和o1最引人注目的改進“思維鏈”的提出者Jason Wei。
這場發(fā)布會上主要更新的內(nèi)容有兩個:放出o1完全體,推出每月200美元的ChatGPT Pro。ChatGPT Pro可以無限制訪問o1完全體。
o1完全體
OpenAI在9月發(fā)布了o1前瞻版,跟之前的大模型不一樣的是,o1犧牲了速度,展示了思維鏈,能做更復(fù)雜的深度思考。在過去的三個月里,我們一直沒有見到o1的完整形態(tài),前瞻版也只能供付費用戶使用,F(xiàn)在完全版終于來了。
Max Schwarzer表示,比起前瞻版,o1完整版速度更快,正確率更高,更加智能,不會對每個問題都想老半天。
他說:“我們對這個模型進行了一系列非常詳細的人工評估,我們發(fā)現(xiàn),它犯重大錯誤的次數(shù)比o1預(yù)覽版減少了約34%,同時充分思考的速度卻提高了約 50%。 ”
在發(fā)布會上他們現(xiàn)場演示了三個例子。
Schwarzer是歷史愛好者,他問了o1和o1前瞻版同一個問題,讓它們列出公元二世紀的羅馬皇帝,講一下他們的在位年代和功績。這個問題不難,但是GPT-4o經(jīng)常給出錯誤答案。
左側(cè)是o1,右側(cè)是o1前瞻版|OpenAI
在現(xiàn)場的演示中,兩個模型都給出了正確答案,但是o1只用了14秒就給出了答案,o1前瞻版用了33秒。
“同樣的問題我離線測試了幾次,發(fā)現(xiàn)o1平均比o1預(yù)覽版快60%!盨chwarzer說。
第二個例子是Hyung Won Chung演示的多模態(tài)功能。
作為熱力學博士,Hyung Won Chung手繪了一張在太空里建數(shù)據(jù)中心的示意圖,在這個設(shè)計里,數(shù)據(jù)中心靠巨大的太陽能板獲取能量,然后靠散熱板冷卻GPU。
Hyung Won Chung給o1出的題是,這個數(shù)據(jù)中心功率是一千兆瓦,要讓數(shù)據(jù)中心正常運轉(zhuǎn),冷卻板的最小面積是多少?
o1發(fā)現(xiàn)這個問題里沒有說明冷卻的溫度是多少,它按照常識把溫度設(shè)定為室溫,然后迅速算出了冷卻板的面積是242萬平方米。
第三個例子是Jason Wei演示的,他讓o1找到符合描述的蛋白質(zhì)。之前的o1前瞻版沒法回答這個問題。
Wei給了o1六個標準,每一個標準都需要調(diào)用特定領(lǐng)域的化學知識,可能有很多蛋白質(zhì)符合這些,所以o1需要評估所有候選項,然后對照六個標準一條一條進行檢驗。
最終o1在53秒后給出了正確答案,還展示了思維過程。
這三個例子分別展示了o1速度上的提升、強大的多模態(tài)功能,和深度思考能力的提高。
實測解幾何題能力大大提高
我們第一時間用o1完全版做了測試。
先問了一個初中物理題,以下三組中,哪個提起重物所需的力最?
o1幾乎秒給答案,還把思考路徑寫了出來,詳細到能做習題輔導(dǎo)。
第二個是邏輯推理題,需要按照規(guī)律填出缺失的數(shù)字,令人聯(lián)想到一些考公題。
這道題o1想了1分41秒,也給出了正確答案,思考過程如下:
在直播的最后,奧爾特曼說,ChatGPT Pro后續(xù)還會推出更多功能,比如網(wǎng)頁瀏覽,文件上傳,函數(shù)調(diào)用等,明天的直播內(nèi)容主要是面對開發(fā)者的一些更新。
作者:翻翻、Steed
封面圖來源:OpenAI
本文來自果殼,未經(jīng)授權(quán)不得轉(zhuǎn)載.