AI大模型正在給高度復(fù)雜且保守的核電行業(yè)帶來新變革。
近日在無錫舉行的首屆山水東路科創(chuàng)谷創(chuàng)新合作論壇期間,中國廣核集團福建寧德核電有限公司(下稱寧德核電)人工智能實驗室負責(zé)人王澍向澎湃新聞介紹,該公司于今年3月發(fā)布的“錦書”核工業(yè)大語言模型,是目前在全球范圍內(nèi)參數(shù)量最大的核工業(yè)預(yù)訓(xùn)練大語言模型,主要具有AI講師、知識庫管理、人才管理和人因預(yù)測四個方面的功能,預(yù)計在2025年年底投入生產(chǎn)領(lǐng)域普遍應(yīng)用。
公開報道顯示,“錦書”大語言模型擁有中國最大的核工業(yè)大模型語料庫,訓(xùn)練語料超過20億token,涵蓋了核運行、核物理、核燃料、水化學(xué)十余類通用核工業(yè)語料以及規(guī)程、系統(tǒng)設(shè)計書、經(jīng)驗反饋單等十余種工作文件語料。“錦書”旨在探索利用AI大模型解決核電行業(yè)面臨的各種挑戰(zhàn),如知識管理不足、低腦力勞動過多、安全分析能力有待增強等。
此外,寧德核電團隊首次開發(fā)出適用于核工業(yè)的專屬Nuclear-embedding-v1-base-cn詞向量模型和Nuclear-reranker-v1-base-cn模型,在由50萬條向量數(shù)據(jù)構(gòu)建的nuclear benchmark數(shù)據(jù)集上展示了卓越的性能,top1召回率超過88%,top2召回率超91%,top5召回率超過95%。
核電廠的生產(chǎn)現(xiàn)場涉及36萬種不同類型的設(shè)備,基本同時運作。與此同時,核電行業(yè)奉行“凡是沒有被證明安全的,一律認為不安全”的安全觀。如果AI大模型能在如此嚴(yán)苛的場景中被驗證可行,其經(jīng)驗將為該技術(shù)在其他工業(yè)領(lǐng)域的應(yīng)用帶來極大的借鑒意義。
“機器比人更可靠”,這句核電運行安全諺語背后的現(xiàn)實是,人因失誤長期以來被視為影響核電站安全效能的決定性因素之一。不光核電,軍事裝備、航空航天等復(fù)雜工業(yè)系統(tǒng)領(lǐng)域也一直高度重視人因研究,并制定了相關(guān)標(biāo)準(zhǔn)規(guī)范。
王澍稱,大模型的出現(xiàn),使核電企業(yè)探索“人因預(yù)防”到“人因預(yù)測”成為可能。傳統(tǒng)的人因失誤預(yù)防方法主要依賴于事后分析和規(guī)則制定,隨著大數(shù)據(jù)和人工智能技術(shù)的迅速發(fā)展,核電站安全管理有望邁入一個新時代從被動的事后應(yīng)對轉(zhuǎn)變?yōu)榍罢靶缘娘L(fēng)險預(yù)測,實現(xiàn)人因預(yù)防到人因預(yù)測。
核電數(shù)字化探索,離不開產(chǎn)學(xué)研協(xié)作。
王澍向澎湃新聞表示,目前,實現(xiàn)科研成果產(chǎn)業(yè)化、“打通從實驗室到市場的最后一公里”,主要存在兩個痛點。
第一個痛點是技術(shù)成熟度的理解偏差。高校和科研院所往往根據(jù)一項科研成果在實驗室環(huán)境下的表現(xiàn)判斷技術(shù)是否成熟。但在業(yè)界看來,科研成果到實際商業(yè)應(yīng)用的落地需經(jīng)過進一步中介實驗的驗證,這一環(huán)節(jié)的缺失導(dǎo)致科研成果和商業(yè)應(yīng)用的落地之間存在鴻溝。
第二個痛點是雙向人才機制的缺位。行業(yè)內(nèi)長期存在著“理性人”假設(shè),即認為科研人員能夠完全聽懂業(yè)界人員的需求。但在實際操作中,既懂工業(yè)又懂新技術(shù)人才的缺失,使得學(xué)界與業(yè)界的溝通過程并不通暢。建立“雙向奔赴”的人才機制迫在眉睫。
為此,寧德核電與浙江大學(xué)理順合作機制,推出了核工業(yè)大語言模型“錦書”。
在反復(fù)磨合中,寧德核電探索出一條高效的產(chǎn)學(xué)研合作之路:由企業(yè)來把控專業(yè)團隊的組成,促進科研人員和企業(yè)技術(shù)人員的交流;建立由企業(yè)主導(dǎo)的產(chǎn)學(xué)研關(guān)系,院所與企業(yè)在前期的研發(fā)過程中進行對接,從企業(yè)需求出發(fā)定制個性化研發(fā)方案;與上海技術(shù)交易所合作,打造開放性的科研平臺,充分整合社會資源。
王澍認為,此次論壇將在人才培養(yǎng)和知識產(chǎn)權(quán)確權(quán)確價兩方面為“新質(zhì)研究”轉(zhuǎn)化為“新質(zhì)生產(chǎn)力”提供助力。一方面,AI大模型在核電等垂直領(lǐng)域的應(yīng)用需要大量復(fù)合型人才,而復(fù)合型人才的培養(yǎng)對一家企業(yè)來講成本過大。無錫市委和上海技術(shù)交易所協(xié)同搭建的資源交流平臺有助于節(jié)約人才引進成本,促進AI大模型在全核電行業(yè)的推廣。
另一方面,論壇還有助于實現(xiàn)知識產(chǎn)權(quán)的確權(quán)確價,實現(xiàn)多方共贏。王澍認為,AI大模型這一技術(shù)具有特殊性,不僅技術(shù)前沿,且在企業(yè)間具有可復(fù)制性。此次論壇基于區(qū)域科技的發(fā)展制定相匹配的制度,有利于“錦書”大語言模型在核電發(fā)電企業(yè)自身獲利的同時向全產(chǎn)業(yè)推廣,實現(xiàn)各方互利共贏。