在巴別塔的傳說中,人們第一次意識(shí)到了語言共通的重要性。要知道,當(dāng)前世界上存在的語言超過6900種。不過時(shí)至今日,人們已經(jīng)能夠在日常交流、音視頻、線上會(huì)議、直播互動(dòng)中無障礙的進(jìn)行交流,背后離不開機(jī)器翻譯的助力。作為字節(jié)跳動(dòng)旗下的企業(yè)級(jí)技術(shù)服務(wù)平臺(tái),“火山翻譯”每天為來自全球的過億用戶提供著服務(wù)。“火山翻譯一方面承載了公司的國際化推進(jìn),通過機(jī)器翻譯和AI技術(shù)打破語言障礙,讓不同國家的人可以隨時(shí)溝通,另一方面也會(huì)支持公司業(yè)務(wù)的發(fā)展,為飛書、今日頭條等多款產(chǎn)品提供了穩(wěn)定和高質(zhì)量的翻譯服務(wù),對(duì)外與火山引擎攜手,滿足更多客戶的使用需求。”在AICC 2021期間,字節(jié)跳動(dòng)AI LAB機(jī)器翻譯負(fù)責(zé)人王明軒在接受采訪時(shí)談到。
字節(jié)跳動(dòng)AI LAB機(jī)器翻譯負(fù)責(zé)人王明軒
據(jù)了解,火山引擎是字節(jié)跳動(dòng)旗下的企業(yè)級(jí)技術(shù)服務(wù)平臺(tái),將字節(jié)跳動(dòng)快速發(fā)展過程中積累的增長方法、技術(shù)工具和能力開放給外部企業(yè),提供云、AI、大數(shù)據(jù)技術(shù)等系列產(chǎn)品和服務(wù),幫助企業(yè)在數(shù)字化升級(jí)中實(shí)現(xiàn)持續(xù)增長。火山翻譯是火山引擎的核心AI中臺(tái)能力之一,日均處理的數(shù)據(jù)在百億級(jí)規(guī)模,對(duì)話達(dá)到數(shù)億句,打造了各大場景智能翻譯解決方案,對(duì)于基礎(chǔ)設(shè)施的算力有著很高的需求,對(duì)此,浪潮也提供了強(qiáng)有力的支持。
火山翻譯曾開源了一款耗時(shí)四年自研的Transformer類模型推理加速引擎LightSeq,對(duì)序列特征提取器和自回歸的序列解碼器做了深度優(yōu)化買,可以應(yīng)用于機(jī)器翻譯、自動(dòng)問答、智能寫作、對(duì)話回復(fù)生成等多文本生成場景,大幅提高線上模型推理速度,改善了使用體驗(yàn),降低了運(yùn)營服務(wù)成本,具備高性能、支持模型功能多、簡便易用(無縫對(duì)接Tensorflow、PyTorch等ML框架)等特點(diǎn),并且提供了豐富的二次開發(fā)工具,通過插入自定義層或修改命令行參數(shù)等方式,即可在各種流行訓(xùn)練庫上輕松使用。在今年6月的版本更新后,該引擎在不同批處理大小下,相較主流訓(xùn)練庫最高可加速三倍左右。
目前,火山翻譯擁有通用翻譯、視頻翻譯、火山同傳三大產(chǎn)品,具備文本翻譯、語音翻譯、圖像翻譯和語種識(shí)別四種能力,在辦公、娛樂和新聞等場景表現(xiàn)較好,支持56門語種、3080個(gè)語向的翻譯。對(duì)于浪潮、微軟、NVIDIA等企業(yè)陸續(xù)發(fā)布的巨量算法模型,王明軒同樣表示了期待,“我們比較關(guān)注多模態(tài)和大數(shù)據(jù),希望把語音文本、視頻等信息統(tǒng)一起來,構(gòu)建一個(gè)大模型,讓多模態(tài)的信息表達(dá)得更好,大幅改善翻譯等場景的效果。”此前,火山翻譯也開源了融合五六十種云的大模型,可以同時(shí)處理超過50種語言,后續(xù)會(huì)擴(kuò)大至支持150個(gè)云。
從跨模態(tài)到泛娛樂,火山翻譯在翻譯效果上不斷精進(jìn),背后則是要解決不少問題,例如字節(jié)跳動(dòng)的國際化業(yè)務(wù)快速擴(kuò)張,在世界各地的溝通交流挑戰(zhàn)亟待解決,并且隨著業(yè)務(wù)模式的多元化,平臺(tái)所承載的內(nèi)容也愈發(fā)復(fù)雜,包括語音、圖像、視頻等等,引發(fā)了對(duì)多語言和多模態(tài)的研發(fā)需求,此次來解決通用性的難題;鹕椒g還與合作伙伴共同推出了終端產(chǎn)品,如VolctransGlass AR智能翻譯眼鏡,可以實(shí)現(xiàn)畫面自動(dòng)翻譯、拍照翻譯、實(shí)時(shí)語音識(shí)別和翻譯等功能,融合了語音識(shí)別、圖像識(shí)別等技術(shù),用戶帶上眼鏡就能所見即所得、所聽即所得。
除此之外,火山翻譯還有包括火山同傳、火山翻譯API、火山翻譯Studio、瀏覽器翻譯助手等矩陣產(chǎn)品。以火山同傳為例,這是由火山翻譯團(tuán)隊(duì)超過40位頂尖科學(xué)家、工程師打磨出的機(jī)器翻譯模型。在高魯棒性的翻譯模型、音視頻樣本庫和軟件平臺(tái)的統(tǒng)籌配合下,能夠既保證設(shè)備穩(wěn)定運(yùn)行,同時(shí)實(shí)現(xiàn)較高的譯出率,實(shí)現(xiàn)人工翻譯的精準(zhǔn)度和機(jī)器翻譯的時(shí)效性的深度結(jié)合。
今年7月,火山翻譯斬獲了ACL 2021的最佳論文(《Vocabulary Learning via Optimal Transport for Neural Machine Translation》),研究提出了一種新的詞表學(xué)習(xí)方案VOLT,在多種翻譯任務(wù)上取得了優(yōu)秀結(jié)果,可以快速給不同語言找到匹配的詞表粒度和大小,對(duì)多語言翻譯、稀有語對(duì)翻譯有重要的應(yīng)用價(jià)值。至今,已有一系列NLP的相關(guān)研究成功應(yīng)用于火山翻譯,為抖音、今日頭條、飛書、西瓜視頻等產(chǎn)品提供優(yōu)質(zhì)的翻譯服務(wù)。火山翻譯團(tuán)隊(duì)在人工智能頂級(jí)國際學(xué)術(shù)會(huì)議已經(jīng)發(fā)表了70多篇學(xué)術(shù)論文,在國際機(jī)器翻譯大賽上獲得9項(xiàng)冠軍。
未來,火山翻譯會(huì)在數(shù)據(jù)安全方面做更多的努力,在保障用戶數(shù)據(jù)隱私的情況下直接在終端上進(jìn)行翻譯處理。可以看到,火山翻譯的機(jī)器翻譯團(tuán)隊(duì)在算法模型、開源代碼等方面做出了不少貢獻(xiàn),在前沿論文、技術(shù)創(chuàng)新、賽事評(píng)選中也屢創(chuàng)佳績。更重要的是,火山翻譯還支撐著月均數(shù)億的活躍用戶使用,產(chǎn)品實(shí)力顯然是過硬的。
“我們會(huì)把豐富的原子能力包裝成各種各樣的解決方案提供給相應(yīng)的行業(yè),翻譯、圖像識(shí)別、語音識(shí)別各自都是一種原子能力,組合之后就是一種解決方案,比如視頻翻譯方案、AI眼鏡方案等等,之后再與行業(yè)場景結(jié)合。”王明軒表示,“我們要保證原子能力做到行業(yè)內(nèi)最好,再把這些原子能力包裝成方案,每個(gè)環(huán)節(jié)都做好后,這個(gè)方案才是穩(wěn)定的。就像造火箭一樣,我們的原子能力就是其中的零件,我們要保證這個(gè)零件是精確的,這樣最后組合出來的產(chǎn)品才是經(jīng)得起市場考驗(yàn)的。”
(7805667)