每經(jīng)記者:可楊每經(jīng)編輯:楊夏
在如今的大模型時(shí)代,市場(chǎng)上已經(jīng)不乏具備翻譯功能的大模型,但對(duì)于出版業(yè)而言,真正的挑戰(zhàn)在于如何確保翻譯的質(zhì)量和精確度,以滿(mǎn)足出版社級(jí)別的高標(biāo)準(zhǔn)!盎旌蠈(zhuān)家模型”通過(guò)對(duì)商務(wù)印書(shū)館出版的哲學(xué)、歷史、法學(xué)、經(jīng)濟(jì)等上百個(gè)專(zhuān)業(yè)領(lǐng)域書(shū)籍的翻譯術(shù)語(yǔ)庫(kù)的訓(xùn)練,確保譯文精準(zhǔn)度達(dá)到“出版級(jí)”,解決傳統(tǒng)機(jī)器翻譯準(zhǔn)確度差、原文上下文理解不足、譯文機(jī)翻痕跡重等核心問(wèn)題。
《每日經(jīng)濟(jì)新聞》創(chuàng)刊20周年之際,第四范式董事長(zhǎng)戴文淵在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)建議,把當(dāng)前的人工智能技術(shù)視為一名實(shí)習(xí)生。實(shí)習(xí)生的初期工作成果可能并不完美,但他們確實(shí)能夠分擔(dān)部分工作負(fù)擔(dān),學(xué)習(xí)到達(dá)一定階段后,這些“實(shí)習(xí)生”或許就能勝任更加復(fù)雜和重要的工作任務(wù)。
未來(lái)工作模式持續(xù)迭代
長(zhǎng)久以來(lái),專(zhuān)業(yè)學(xué)術(shù)翻譯面臨人才稀缺、周期長(zhǎng)、成本高、效率低、難度大等痛點(diǎn),基于此,8月,第四范式與商務(wù)印書(shū)館旗下科技公司萬(wàn)邦同和共同為商務(wù)印書(shū)館建設(shè)學(xué)術(shù)出版專(zhuān)業(yè)大模型,這也是國(guó)內(nèi)首個(gè)出版領(lǐng)域大語(yǔ)言模型。
第四范式的定位是用AI能力服務(wù)各個(gè)垂直領(lǐng)域。以第四范式與商務(wù)印書(shū)館的合作為例,戴文淵指出,雖然當(dāng)前市場(chǎng)上的許多大模型已經(jīng)具備了翻譯功能,但真正的挑戰(zhàn)在于如何確保翻譯的質(zhì)量和精確度。簡(jiǎn)單的機(jī)器翻譯早在十幾年前就已實(shí)現(xiàn),隨著大模型技術(shù)的興起,翻譯質(zhì)量雖然有所提升,但要達(dá)到更為嚴(yán)格和專(zhuān)業(yè)的水準(zhǔn),如出版社級(jí)別的翻譯要求萬(wàn)字之中只允許出現(xiàn)一個(gè)錯(cuò)誤,并且必須確保術(shù)語(yǔ)的專(zhuān)業(yè)性,那么,大多數(shù)的通用模型還無(wú)法滿(mǎn)足這一需求。
第四范式與商務(wù)印書(shū)館的合作,是基于商務(wù)印書(shū)館多年來(lái)在數(shù)據(jù)與專(zhuān)家資源層面的累積,共創(chuàng)一款能夠達(dá)到出版級(jí)別的專(zhuān)用大模型,這是第四范式在眾多垂直領(lǐng)域探索與實(shí)踐之一。將大模型應(yīng)用于出版這樣的高度專(zhuān)業(yè)化領(lǐng)域,并非第四范式一己之力能夠做到,而是一個(gè)雙方深度合作的過(guò)程,即所謂的“混合專(zhuān)家模型”。戴文淵介紹,這背后的運(yùn)作邏輯在于,模型會(huì)持續(xù)分析并學(xué)習(xí)商務(wù)印書(shū)館的專(zhuān)業(yè)數(shù)據(jù),同時(shí)每天輸出翻譯成果。這些成果并非直接用于出版,而是需要經(jīng)過(guò)商務(wù)印書(shū)館專(zhuān)家的指導(dǎo)和反饋。例如,當(dāng)某句話(huà)的翻譯不夠準(zhǔn)確時(shí),專(zhuān)家會(huì)提出改進(jìn)意見(jiàn),這些意見(jiàn)隨后被納入AI的學(xué)習(xí)過(guò)程中,從而實(shí)現(xiàn)模型的持續(xù)優(yōu)化和提升。
戴文淵認(rèn)為,這恰恰代表了未來(lái)AI的工作模式:不再是簡(jiǎn)單的“客戶(hù)提供數(shù)據(jù)、公司輸出模型”的單一流程,而是一個(gè)持續(xù)迭代、不斷優(yōu)化的過(guò)程。以商務(wù)印書(shū)館為例,假設(shè)其團(tuán)隊(duì)中原本有五位專(zhuān)家,現(xiàn)在加入了一名“機(jī)器人員工”。這名新員工與五位專(zhuān)家一起工作,每天在專(zhuān)家的指導(dǎo)下產(chǎn)出并改進(jìn)工作成果,隨著時(shí)間的推移,他能夠承擔(dān)的工作任務(wù)會(huì)越來(lái)越多,從而提升了商務(wù)印書(shū)館的出版效率。
AI將從后臺(tái)走向前臺(tái)
戴文淵認(rèn)為,對(duì)于出版行業(yè)來(lái)說(shuō),擁抱新技術(shù)已成為不可逆轉(zhuǎn)的趨勢(shì)。
他表示,回想三四十年前,電腦確實(shí)逐漸替代了人們當(dāng)時(shí)的大部分工作,然而,人類(lèi)總能發(fā)掘出新的價(jià)值所在。如今,我們正身處另一個(gè)變革的時(shí)代,未來(lái)AI技術(shù)同樣有可能接管人類(lèi)目前從事的眾多工作。但這并不預(yù)示著“人”被替代,相反,人類(lèi)一定能探尋到新的、能夠發(fā)揮價(jià)值的領(lǐng)域。
從長(zhǎng)遠(yuǎn)的角度看,對(duì)于出版業(yè)等傳統(tǒng)行業(yè)而言,接納這些以模型為代表的新興技術(shù),最先顯現(xiàn)的改變,將是效率的顯著提升,與之相應(yīng)的,利潤(rùn)水平也會(huì)迎來(lái)增長(zhǎng),與此同時(shí),戴文淵認(rèn)為,如果效率能達(dá)到極致提升,商業(yè)模式也可能隨之改變。
他舉例稱(chēng),未來(lái)的傳播媒介可能不再局限于紙質(zhì),而是真正轉(zhuǎn)向電子書(shū),這將大幅降低傳播成本,書(shū)籍的售價(jià)可能從現(xiàn)今的幾十元甚至上百元,低至一分、兩分,這一定需要技術(shù)的革新,他認(rèn)為,顛覆性的變革,不僅局限于出版業(yè),所有行業(yè)都需要做好準(zhǔn)備,迎接技術(shù)革新可能帶來(lái)的顛覆性影響。生產(chǎn)力的革新,勢(shì)必會(huì)引發(fā)生產(chǎn)關(guān)系和商業(yè)模式的重塑,因此,探尋新的商業(yè)模式顯得至關(guān)重要。
從第四范式的視角來(lái)解讀,戴文淵認(rèn)為,新質(zhì)生產(chǎn)力代表的是一種價(jià)值獲取模式的轉(zhuǎn)變。
他表示,過(guò)去的增長(zhǎng)模式,類(lèi)似于不斷地建造新的房屋,從兩座到第三座、第四座,從而實(shí)現(xiàn)增長(zhǎng)。然而,在新的生產(chǎn)力模式下,我們或許無(wú)需再通過(guò)建造更多的房屋實(shí)現(xiàn)增長(zhǎng),而是對(duì)現(xiàn)有的兩座房屋進(jìn)行翻修和升級(jí)。改造后,這兩座房屋不僅能容納原先四座房屋的人數(shù),還能為他們提供更加優(yōu)越的居住體驗(yàn)。而這種模式的轉(zhuǎn)變,無(wú)疑會(huì)讓那些過(guò)去對(duì)數(shù)字化轉(zhuǎn)型或智能化不感興趣的企業(yè),開(kāi)始重新?lián)肀н@種轉(zhuǎn)型。
戴文淵認(rèn)為,這是必然趨勢(shì),因?yàn)楫?dāng)前已經(jīng)難以再依賴(lài)大規(guī)模的資源和投資來(lái)拉動(dòng)增長(zhǎng),而必須依靠效率的提升來(lái)驅(qū)動(dòng)價(jià)值的增長(zhǎng)。在擁有充足空地的情況下,似乎只需增加房屋建設(shè)即可實(shí)現(xiàn)增長(zhǎng),那么技術(shù)進(jìn)步的重要性就顯得不那么關(guān)鍵了。從當(dāng)前情況來(lái)看,必須朝著優(yōu)化現(xiàn)有土地使用的方向努力。
每日經(jīng)濟(jì)新聞