新京報(bào)貝殼財(cái)經(jīng)訊(記者 羅亦丹)3月20日,北京智源人工智能研究院發(fā)布了包括中文、多模態(tài)、認(rèn)知、蛋白質(zhì)預(yù)測在內(nèi)的超大規(guī)模智能模型“悟道1.0”。智源研究院院長,北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授黃鐵軍表示,近年來人工智能的發(fā)展,已經(jīng)從“大煉模型”逐步邁向了“煉大模型”階段。
“過去五年多,全球研究人工智能研究者最重要的就是訓(xùn)練各種各樣的模型,這幾年有一點(diǎn)‘千村萬戶煉模型’的狀態(tài)。不論大小公司還是學(xué)校,都是拿一個(gè)開源的框架,收集一批數(shù)據(jù),然后拿著這個(gè)模型去解決問題。雖然這是可以成功的,但作為一個(gè)現(xiàn)代化產(chǎn)業(yè),近年來人工智能的發(fā)展應(yīng)該從家家戶戶‘大煉模型’的狀態(tài)逐漸變?yōu)榘奄Y源匯聚起來,訓(xùn)練超大規(guī)模模型的階段,通過設(shè)計(jì)先進(jìn)的算法,整合盡可能多的數(shù)據(jù),匯聚大量算力,集約化地訓(xùn)練大模型,供大量企業(yè)使用,這是必然趨勢。”黃鐵軍表示。
智源研究院學(xué)術(shù)副院長唐杰介紹,“悟道1.0”先期啟動(dòng)了4個(gè)大模型的研發(fā),包括面向中文的預(yù)訓(xùn)練語言模型、首個(gè)公開的中文通用圖文多模態(tài)預(yù)訓(xùn)練模型、我國首個(gè)具有認(rèn)知能力的超大規(guī)模預(yù)訓(xùn)練模型以及超大規(guī)模蛋白質(zhì)序列預(yù)測預(yù)訓(xùn)練模型。
新京報(bào)貝殼財(cái)經(jīng)記者了解到,以其中文通用圖文多模態(tài)預(yù)訓(xùn)練模型為例,該模型參數(shù)量達(dá)10億,基于從公開來源收集到的5000萬個(gè)圖文進(jìn)行訓(xùn)練,是首個(gè)公開的中文通用圖文多模態(tài)預(yù)訓(xùn)練模型。目前,該模型已經(jīng)落地了可以為用戶上傳照片配文,以及利用圖片和歌詞相關(guān)性為用戶上傳照片搭配音樂的小程序及應(yīng)用。
新京報(bào)貝殼財(cái)經(jīng)記者 羅亦丹 編輯 岳彩周 校對 趙琳