圖片來源:視覺中國
務(wù)實點(diǎn)看,大模型要先走向行業(yè);再務(wù)實點(diǎn),華為云直接將博士們推向了一線。
盤古大模型初見真章是在2021年4月,NLP大模型與CV大模型正式發(fā)布;此后,科學(xué)計算大模型、藥物分子大模型、礦山大模型和萬眾矚目的氣象大模型等紛紛浮出水面;再到此前7月7日,華為開發(fā)者大會發(fā)布盤古大模型3.0,9月21日華為全聯(lián)接大會發(fā)布盤古汽車大模型和醫(yī)學(xué)大模型,華為云逐漸將盤古大模型在各行業(yè)的布局徐徐展開。
可是,做B端市場不是件容易的事情,貼近生活的大語言模型雖說能夠滿足豐富的日常交互,但其本身的語料內(nèi)容缺乏不同行業(yè)的專業(yè)背景,在工作實用性上難以深入;金融、醫(yī)療、生物、氣象等垂直領(lǐng)域真正能觸發(fā)大模型潛力,需要大模型設(shè)計者了解特定的行業(yè),而行業(yè)術(shù)語、行業(yè)邏輯、行業(yè)場景等,是大模型算力、算法技術(shù)之外的天地。
行先于言,過去幾年,華為云把一批又一批博士、專家、科學(xué)家派到客戶現(xiàn)場,走田頭、跑工地、下礦井、進(jìn)車間,目前已幫助超過1000家企業(yè)落地智能化創(chuàng)新項目。今年,華為云還計劃將200+博士送到一線。長遠(yuǎn)來看,做出實用、好用的行業(yè)大模型,了解行業(yè)才是先見。
隔行如隔山
行業(yè)大模型是“行業(yè)”+“大模型”,實為兩個不同的專業(yè)與專業(yè)的結(jié)合碰撞。
好用的行業(yè)大模型首先是要懂行業(yè),最終的產(chǎn)品需要運(yùn)行在每個車間、礦井、田間地頭,使用者說好,才算實現(xiàn)大模型落地這一關(guān)。將博士送往一線,是華為云做出的最樸實的決定。
在所有前往一線的博士們印象中,“隔行如隔山”的感受在預(yù)想之內(nèi),但還是來得有些“生猛”。華為不缺擅長大模型的專業(yè)技術(shù)人才,也不缺來自各行業(yè)的一線經(jīng)驗,但每個行業(yè)都有自己的專業(yè)術(shù)語和獨(dú)特業(yè)務(wù),與博士們本職的技術(shù)研發(fā)工作相比,知識壁壘的確存在。尤其在行業(yè)體系更復(fù)雜的自動駕駛、金融、重工業(yè)等領(lǐng)域,這些阻隔更為強(qiáng)烈。
先拿自動駕駛來說,華為云EI人工智能算法專家金博士對于下一線有著頗多感悟。
“初次進(jìn)入自動駕駛行業(yè),感受到的是其技術(shù)鏈條非常長,行業(yè)體系龐大。”金博士直言。原來在縱深的自動駕駛行業(yè)技術(shù)鏈條中,只硬件層面就包含了車輛硬件、視覺和雷達(dá)等多傳感器的選型、傳感器的布局安裝等細(xì)節(jié);軟件層面則分類更多,圍繞數(shù)據(jù)與算法,包含了數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注、感知算法、定位算法、決策規(guī)劃和執(zhí)行控制等等。而每一個模塊,都有各自對應(yīng)的專業(yè)團(tuán)隊。
所謂隔行如隔山,在眾多專業(yè)模塊中,找到華為云盤古大模型在自動駕駛行業(yè)的切入點(diǎn),則是最難的業(yè)務(wù)問題。破題的火苗,出現(xiàn)在金博士與客戶共同的“封閉會戰(zhàn)”期間,“那段時間經(jīng)常是6點(diǎn)多出發(fā)的高鐵去上海,有一次我坐在位置上閉上雙眼,腦海里沖擊著完全不同的兩個畫面:早晨起床看窗外僅僅亮著那么三四盞燈,和幾小時后淹沒在一杯一杯水中的密集交談、連帶著高速頭腦風(fēng)暴,一根根頭發(fā)都立了起來。”
需要高強(qiáng)度溝通的客戶很多,傳統(tǒng)車企、造車新勢力、自動駕駛科技公司等不同類型行業(yè)客戶,都在落地大模型所要溝通了解的范圍之中,這些行業(yè)在一線的業(yè)務(wù)問題或多或少都有不同。不過,對金博士來說,行業(yè)多也好理解難也罷,想要創(chuàng)造出好用的東西,理解都是第一步,但總要走這第一步。
比對、總結(jié)、與思緒紛飛,溝通的成功讓大家落實了切入方向?qū)Ω队绊懜唠A自動駕駛落地的關(guān)鍵因素:各類不常見但不斷出現(xiàn)的“長尾問題”,因為如何加速長尾場景的數(shù)據(jù)閉環(huán),是自動駕駛量產(chǎn)的關(guān)鍵。
大模型時代,自動駕駛行業(yè)的突破依賴高質(zhì)量、高場景覆蓋度、精細(xì)標(biāo)注的數(shù)據(jù)。而現(xiàn)在的問題恰恰是:當(dāng)前路采數(shù)據(jù)采集效率低、成本高、corner case數(shù)據(jù)難獲取,場景覆蓋率低。一個包含視覺、雷達(dá)等多傳感器的10秒clip,采集標(biāo)注等成本卻達(dá)幾百元,而自動駕駛需要的,是幾百萬小時的行駛數(shù)據(jù)。下到了一線后,金博士才如此真切地體會到了自動駕駛數(shù)據(jù)的價值。
科學(xué)家費(fèi)曼說“只要我不能創(chuàng)造的,我就還不理解”。也正是在博士們一線的深入體會與理解中,盤古汽車大模型能夠生成多種Corner case場景,讓自動駕駛遍歷各種復(fù)雜場景變成可能。
通過應(yīng)用盤古大模型,自動駕駛的Corner Case可以實現(xiàn)天級的閉環(huán),顯著提高數(shù)據(jù)閉環(huán)效率。基于盤古大模型的場景生成能力,企業(yè)可以構(gòu)造出雨天、下雪天的場景用于模型的訓(xùn)練,不必等待特殊天氣才能進(jìn)行數(shù)據(jù)采集。此外,20%的路測工作也可以通過大模型的場景生成來實現(xiàn),縮短了里程積累的周期。大模型能夠快速地構(gòu)建出場景豐富的樣本,而且對樣本的數(shù)量要求也只有以前小模型的十分之一。
山外有山
只是山外還有山,除了打破行業(yè)間專業(yè)壁壘的難題,橫亙在大模型設(shè)計者與使用者之間的,還有來自一線客戶的真實需求,這往往與預(yù)想中不一致。做行業(yè)大模型,首先要尊重行業(yè),其次要尊重來自一線的從業(yè)者的經(jīng)驗。
參與盤古金融大模型研發(fā)的謝博士感受尤為深刻:“深入一線后,我們對金融行業(yè)客戶現(xiàn)場交付有了新的認(rèn)知,客戶側(cè)存在不同的業(yè)務(wù)線、不同背景的人,因此他們對大模型的需求和偏好是多樣的,甚至有時,需求的特點(diǎn)是相對的。”
比如,宣傳部門希望大模型生成的內(nèi)容要更發(fā)散,更有創(chuàng)意性,能夠幫助他們打開思路;但授信部門要撰寫授信報告,則要求大模型生成的內(nèi)容更客觀、更精確、更尊重原文。“引導(dǎo)客戶群說出他們在工作中遇到的難點(diǎn)與真實需求是必要的。”謝博士說到。
在一線,謝博士收集了宣傳部門人員在撰寫宣傳文案會考慮宣傳的對象特點(diǎn)作為人設(shè),比如以年齡段來區(qū)分,針對老人、中年人、大學(xué)生等分別對應(yīng)的寫作文案的特點(diǎn),將這些信息加入到prompt中,就能很好提升大模型生成效果。針對授信部門的人群,發(fā)現(xiàn)他們在撰寫過程中經(jīng)常引用財報等專業(yè)性較高的材料,那么在大模型書寫過程中,就需要提示大模型參考特定材料,書寫與原文保持一致。也正如此,不同場景的需求都在盤古金融大模型中有了精細(xì)劃分。
而深入溝通,除了能夠了解最真實的業(yè)務(wù)需求外,還聊出了更多業(yè)務(wù)之外的想法。祝博士主要負(fù)責(zé)了金融大模型的落地,更專注于盤古大模型的效果評測與效果提升。和銀行員工的交流,是他在一線活動中印象最深刻的事。
大模型成風(fēng)的那段時間,“我會不會失業(yè)?”“會不會有一天,我將被技術(shù)終結(jié)?”這些飄零的話語深深叩問著職場打工人的心。是擁抱技術(shù)還是換個姿勢擁抱技術(shù),大家深知,其實我們沒有選擇權(quán)。但當(dāng)這看似遙遠(yuǎn)的事被真正考慮在企業(yè)發(fā)展中,還是會有些不可思議。
針對人力密集型場景,也就是大模型提質(zhì)增效最具想象的場景,有銀行表示并不希望員工被大模型取代,而應(yīng)該讓大模型提升服務(wù)質(zhì)量與服務(wù)效率,釋放員工做更多更高價值的事;诖讼敕,華為云則聯(lián)合該銀行,梳理了大模型在企業(yè)應(yīng)用的人員轉(zhuǎn)身實踐。
同樣在銀行一線駐扎的祝博士說到:“這次交流也驅(qū)動我們梳理了一整套企業(yè)落地方法論,我們想做到授人以漁,讓企業(yè)、企業(yè)員工深入擁抱新技術(shù),主動應(yīng)用大模型解決業(yè)務(wù)痛點(diǎn)。”通過聯(lián)合實踐,他們形成了一系列培訓(xùn)課程,從產(chǎn)品需求洞察、prompt調(diào)優(yōu)、微調(diào)、大模型運(yùn)營等各個維度,并和遠(yuǎn)程銀行、UX設(shè)計、網(wǎng)點(diǎn)等部門合作,建立聯(lián)合項目組,目的是驅(qū)動企業(yè)人員能力提升。也或許,這才是一線工作人員的真實需求。
最終,付出得到的回報也讓祝博士十分開心。在當(dāng)前已經(jīng)上線的場景中,客戶把網(wǎng)點(diǎn)文檔問答包裝成了該銀行的“爆款”場景,10月時計劃全行推廣,此外,因為應(yīng)用效果比較好,他們還計劃橫向推廣到信貸、金融、內(nèi)審等場景。
見山
過去幾年,通過把一批又一批博士、專家、科學(xué)家派到客戶現(xiàn)場,直面難題、解決難題。除了上文提到的金博士、謝博士、祝博士的經(jīng)歷,華為做過的難事不算少數(shù),也贏得了許多業(yè)內(nèi)好評。
在礦山領(lǐng)域,有博士被送到了山東能源集團(tuán),下到礦井實地調(diào)研,目的是為了解決提升精煤產(chǎn)率這一困擾業(yè)界多年的難題。精煤不僅低碳環(huán)保,而且經(jīng)濟(jì)價值更高,廣泛應(yīng)用于電力、鋼鐵、化工等領(lǐng)域。2022年,我國原煤產(chǎn)量達(dá)到45.6億噸,但精煤產(chǎn)量僅為4.9億噸。
只是,洗選煤生產(chǎn)的工藝參數(shù)涉及100多種,傳統(tǒng)洗選密度控制依靠人工經(jīng)驗確定,無法及時準(zhǔn)確地通過數(shù)據(jù)分析對分選密度進(jìn)行實時調(diào)整,容易導(dǎo)致指標(biāo)波動,造成精煤回收損失。
基于實地考察的結(jié)果,最終博士們提出通過盤古預(yù)測大模型能力,對不同煤層、不同季節(jié)、不同灰分(煤炭完全燃燒后余下的殘渣)的原煤煤質(zhì)數(shù)據(jù)和工藝參數(shù)智能分析,同時,基于華為自研的圖網(wǎng)絡(luò)融合技術(shù)對多個最優(yōu)算法進(jìn)行堆疊、動態(tài)調(diào)優(yōu),能夠精準(zhǔn)預(yù)測精煤產(chǎn)品的灰分值,從而實現(xiàn)重介選煤分選密度的精準(zhǔn)控制與動態(tài)調(diào)整。在這一新方案下,山能濟(jì)二煤礦每年能多產(chǎn)出8000噸精煤。而如果能將這個能力推廣到全國,可以讓每個煤礦每年平均多產(chǎn)出2000噸精煤。
推動“數(shù)智山能”之外,華為云的博士們通過將大模型技術(shù)賦能藥物分子及醫(yī)療,也讓一線的醫(yī)療科研按下加速鍵。
西交大一附院劉冰教授團(tuán)隊發(fā)現(xiàn)世界40年來首個抗生素,就是在盤古藥物分子大模型助力下實現(xiàn)的,目前該項目已進(jìn)入臨床階段,價值達(dá)到了1億美元。據(jù)測算,通過盤古藥物分子大模型,可以將先導(dǎo)藥物研發(fā)周期縮短至1個月,研發(fā)成本降低70%。
負(fù)責(zé)華為科學(xué)計算與生物醫(yī)療領(lǐng)域產(chǎn)品的劉星星博士說到:“我本身是生物醫(yī)療領(lǐng)域的博士,五年前畢業(yè)之后,看到華為在生物醫(yī)療領(lǐng)域投入的決心,以及華為在AI、大模型的整體規(guī)劃吸引了我,因此我決定,那就加入到華為。”
在自己的科研愿景下,劉星星博士也收獲到了想要的東西:“當(dāng)時有個客戶反饋說,和其它大廠也聊了很多,但最終發(fā)現(xiàn)華為最懂他們,我覺得這是最讓我感到自豪的事情。我們長期深入一線的功夫沒有白費(fèi)。”
華為云對待科研的務(wù)實做法,對于一批真正想實現(xiàn)科研落地的人才來說,就是安撫躁動夢想的解藥。
一作發(fā)Nature的華為工程師愷峰,是清華大學(xué)錢學(xué)森力學(xué)班2016級本科畢業(yè)生。7月6日,愷峰和同事們的論文《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報》發(fā)表于Nature雜志,報告了業(yè)內(nèi)“首個在中長期氣象預(yù)報上精度超過傳統(tǒng)數(shù)值預(yù)報方法的AI模型”。這也是近年來中國科技公司首篇作為唯一署名單位的Nature正刊論文。
回憶起盤古氣象大模型,時間穿回2021年底,愷峰在一次偶然的機(jī)會中發(fā)現(xiàn)中期氣象預(yù)報可能是AI很好的運(yùn)用場景。當(dāng)時,他半開玩笑半認(rèn)真地和同事說:“我準(zhǔn)備做一個很大的項目,用2000TB的歷史氣象數(shù)據(jù)去構(gòu)建一個AI模型,要是成功了那么全世界氣象預(yù)報的范式都要被徹底改變。”
當(dāng)時,擺在面前的有三個問題,第一個是天量的數(shù)據(jù),第二個是不均勻的經(jīng)緯度網(wǎng)格和扭曲的等壓面,第三個則是不斷累積的迭代誤差。但在解決問題的過程中,不斷出現(xiàn)了與業(yè)界既定看法相悖的想法。
如何處理歐洲已經(jīng)開放的2000TB的全球氣象數(shù)據(jù)?愷峰首先選用了少量的數(shù)據(jù)作診斷性實驗,但與大部分氣象專家的看法相反,經(jīng)過試驗,他發(fā)現(xiàn)僅使用位勢、溫度、濕度、風(fēng)速四種狀態(tài)就可以很好地建模大氣的演變,同時垂直高度上的層數(shù)對精度的影響很校
此外,為了減少預(yù)測的系統(tǒng)誤差等大部分類似問題,之前都是用自回歸的方式來解決。但實踐表明,這一方式用來做氣象預(yù)測有巨大的弊端自回歸學(xué)到的結(jié)果不可避免的平滑,所有的極端天氣都被忽略了。
“我試了很多很多方法去解決這個問題,包括很多正則類方法,效果都不盡人意。最后解決這個問題的是一個非常簡單的小技巧:我把不同時間的預(yù)測模型分開了,用24小時的模型去做天級的預(yù)報,6小時,3小時,1小時的模型去做更細(xì)致的預(yù)報,這樣來盡可能地減少迭代次數(shù)。這也讓我們成為了唯一可以預(yù)測逐小時天氣的AI模型。”愷峰總結(jié)到。
此前的實習(xí),愷峰做的是純粹的科研,但這是讓他覺得可惜的事情:“兩篇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索相關(guān)的課題都離落地比較遠(yuǎn),所以比較缺乏成就感。記憶里非常多種idea,最終也沒有找到實際場景可以很好的運(yùn)用。當(dāng)時感覺‘人生中第一次做科研’,卻沒有很好的feedback。”
而進(jìn)入華為之后的落地科研,讓愷峰懷抱著激情的同時,真正了解到AI落地與AI科研之間的區(qū)別科研的時候只需要在“imagenet數(shù)據(jù)集”上精度高一兩個點(diǎn)就可以了,但是落地的場景很碎片化,數(shù)據(jù)標(biāo)注流程和質(zhì)量要自己控制,算法調(diào)優(yōu)周期要盡可能的短,樣本數(shù)目比較少但是場景特別多。不過,“落地場景一般做起來都比較快樂”,愷峰說到:“對我而言,更困難的地方是寫各種文字材料,還有就是場景很碎片化,我更想做一些‘價值更大’的問題。”
成為山
華為鼓勵博士、科研人員在一線做難事的同時,也在他們身后擔(dān)當(dāng)起了靠山作用。對待科研,華為確實是慷慨大方的。愷峰說到,在進(jìn)行氣象大模型的訓(xùn)練中,他申請了兩個月的AI算力。在順利的過程推進(jìn)下,他們AI模型精度超過了全球最好的數(shù)值方法,例如,盤古對于臺風(fēng)路徑預(yù)測的準(zhǔn)確度比之前最好的歐洲中心預(yù)報還要高20%。
對內(nèi)慷慨,對外,華為希望共建一個大模型生態(tài)。其實,這也是在推進(jìn)一線工作之后所要走完的最后一公里,讓大模型繼續(xù)下沉。
以云服務(wù)的方式提供騰AI算力,也解決了客戶自訓(xùn)練大模型的難題。畢竟大模型訓(xùn)練依賴極大算力消耗,由于高端GPU芯片出口限制等問題,大模型產(chǎn)業(yè)發(fā)展需要持續(xù)供應(yīng)、自主創(chuàng)新的AI算力。而騰AI云服務(wù),可以實現(xiàn)從算力、芯片使能(CANN算子庫)、AI框架(MindSpore AI計算框架)到AI平臺(AI 開發(fā)生產(chǎn)線ModelArts)的自主創(chuàng)新。
博士們沖在前線做難事、解難題,騰AI云服務(wù)的澎湃算力做靠山,華為遙遙領(lǐng)先的其實是走出科研,走回一線的實踐能力。
回頭看看,那些難以跨過的山巒,也在攀越起伏的決意中,漸行漸遠(yuǎn)。