9月20日,百度首次發(fā)布“2022十大科技前沿發(fā)明”,披露高價值專利成果,多項人工智能、自動駕駛專利技術全球領先?缒B(tài)通用可控AIGC(基于人工智能的內容生成)發(fā)明,全球首次實現語言與視覺大一統(tǒng)的理解與生成,登頂多個國際權威榜單;無人車多傳感器融合處理系統(tǒng),有效支撐百度Robotaxi應對各種城市復雜道路;知識增強大模型鵬城-百度文心是目前全球最大中文單體模型,具備超強的語言理解能力和文學創(chuàng)作能力。
北京市知識產權局副局長李鐘表示,近年來,我國把科技創(chuàng)新作為引領發(fā)展的第一動力,深入實施創(chuàng)新驅動發(fā)展戰(zhàn)略,開啟了建設世界科技強國的新征程。關鍵核心技術專利是國之重器,“十大科技前沿發(fā)明”成果體現了百度多項國際前沿核心技術的實現與突破,對推動經濟發(fā)展和技術進步有著十分重要的意義。
“十大科技前沿發(fā)明”中的跨模態(tài)通用可控AIGC,在通用性上提出了跨模態(tài)、跨任務的統(tǒng)一建模技術,是全球首次實現語言與視覺大一統(tǒng)的理解與生成,登頂VQA、VCR、aNLI三大國際權威榜單。AIGC被認為是顛覆現有內容生產方式的新一代技術。AI作畫就是AIGC的一種,它可以實現以十分之一的成本,以百倍千倍的生產速度,創(chuàng)造出有獨特價值和獨立視角的內容。
AIGC背后是預訓練大模型創(chuàng)新的突破。早在2019年3月 百度發(fā)布了國內首個開源預訓練模型文心ERNIE 1.0。目前,百度文心已經升級成為產業(yè)級知識增強大模型家族,涵蓋以鵬城-百度文心為代表的語言大模型、計算機視覺、跨模態(tài)、生物計算領域的大模型,以及電力、金融、航天等行業(yè)大模型,能夠從大規(guī)模知識和海量數據中融合學習,效率更高、效果更好,具備領先的理解和生成能力。
百度CTO王海峰表示,百度是領先的AI公司,一方面要在科技前沿領域加緊創(chuàng)新和探索,攻關核心關鍵技術,把發(fā)展主動權掌握在自己手里;另一方面,將創(chuàng)新成果與產業(yè)融合,促進產業(yè)發(fā)展,助力高水平科技自立自強。經過二十多年的持續(xù)創(chuàng)新投入,百度產出了很多創(chuàng)新成果,引領技術和產業(yè)發(fā)展方向。百度人工智能技術,全面應用于搜索、信息流以及地圖、翻譯、輸入法、小度智能硬件等產品,助力智能駕駛持續(xù)創(chuàng)新,并通過百度智能云輸出給各行各業(yè),推動千行百業(yè)的數字化轉型和智能化升級。
資料顯示,百度是中國最早布局自動駕駛的企業(yè),技術、運營、產品等成績世界領先。無人車多傳感器融合處理系統(tǒng)專利組合的感知技術目前已經在自動駕駛車輛上得到大規(guī)模應用,實測效果漏檢率總計減少60%,低矮障礙物漏檢率減少83%,有效支撐百度Robotaxi在各種城市復雜道路和場景上無人駕駛能力的構建。
“十大科技前沿發(fā)明”是百度創(chuàng)新投入的一個縮影。截至2022年,百度已在人工智能領域深耕整十年,累計研發(fā)投入超1000億元。百度連續(xù)四年在AI專利申請量和授權量方面蟬聯中國第一。2021年,百度深度學習專利申請量、自動駕駛專利族數量均排名全球第一,并榮獲人工智能交互領域的唯一中國專利金獎,成為人工智能領域獲得中國專利獎獎項最多、獲獎級別最高的高科技企業(yè)。
活動現場,百度還為眾多高質量專利進行了嘉獎。其中,“基于人工智能的人機交互方法和系統(tǒng)”,榮獲第二十二屆中國專利金獎,是迄今為止中國智能交互領域唯一的專利金獎。該專利技術運用知識圖譜及深度學習等技術,以深度語義理解為基礎,實現了跨越語言、語音、圖像等模態(tài)的智能人機交互。“基于弱監(jiān)督的字符檢測器訓練方法”,榮獲第二十三屆中國專利銀獎,這是目前OCR光學字符識別領域唯一的專利獎項,實現了全場景覆蓋、超高精度的光學字符檢測。
百度資深副總裁、總法律顧問梁志祥稱,百度從成立之日起,就高度重視自主創(chuàng)新和專利保護,銖積寸累,建立了完備的知識產權保護機制,激勵創(chuàng)新推動高質量知識產權創(chuàng)造。以技術創(chuàng)新為信仰,以專利保護為保障,百度積累了量、質領先的人工智能專利,構建了全新的人工智能產業(yè)知識產權運營生態(tài)。隨著知識產權保護的全面加強,百度領先的人工智能專利正在持續(xù)釋放價值,支撐公司的產品和業(yè)務發(fā)展,賦能千行百業(yè),為中國人工智能產業(yè)發(fā)展提供自主可控的知識產權驅動力。百度發(fā)布科技前沿發(fā)明,希望與產業(yè)伙伴分享百度的前沿創(chuàng)新成果,共同推動中國數智產業(yè)高質量發(fā)展。
2022十大科技前沿發(fā)明,具體如下:
1.跨模態(tài)通用可控AIGC
該發(fā)明在業(yè)界首次提出語言與視覺統(tǒng)一的理解與生成模型,創(chuàng)新提出融合知識的生成,突破了通用可控內容生成技術瓶頸,實現了文本生成、圖像生成、視頻生成、數字人生成的實用化跨越。發(fā)明已落地業(yè)界首創(chuàng)的圖文轉視頻、高精度數字人生成、文生圖等創(chuàng)新產品,大幅提升了內容生產效率,開創(chuàng)了AI內容生成的新篇章。
2.無人車多傳感器融合處理系統(tǒng)
該項發(fā)明以多傳感器融合為核心,完善激光雷達感知能力,構建了環(huán)視視覺的獨立閉環(huán)能力,已經在自動駕駛車輛上得到大規(guī)模應用,實測效果漏檢率總計減少60%,低矮障礙物漏檢率減少83%,有效支撐百度Robotaxi在各種城市復雜道路和場景上無人駕駛能力的構建。
3.知識增強大模型
該發(fā)明是百度文心大模型的核心技術,其從大規(guī)模知識和海量數據中融合學習,具備領先的理解和生成能力。包括了以全球首個千億級知識增強大模型鵬城-百度文心為代表的語言大模型、計算機視覺、跨模態(tài)等大模型,以及電力、金融、航天等行業(yè)大模型,在百余權威任務取得最好效果,目前已大規(guī)模應用于百度的各類產品,顯著提升各類產品體驗,并通過飛槳和百度智能云支持各行各業(yè)的產業(yè)智能化升級。
4.深度學習通用異構參數服務器架構
該項發(fā)明通過可擴展的架構設計,不僅可以支持基于CPU、GPU、XPU等不同類型硬件的參數服務器架構單獨訓練,還可以通過強化學習算法將同一深度學習模型訓練任務分配到不同類型硬件的計算節(jié)點上進行混合硬件異構訓練,實現計算資源最優(yōu)搭配,從而可減少50%以上的深度學習模型訓練成本,有效提升深度學習模型訓練效率。
5.基于AI的生物計算平臺PaddleHelix
該發(fā)明提出了一系列基于AI的生物計算創(chuàng)新技術,包括自主研發(fā)的高效mRNA疫苗設計LinearDesign算法,全球首個基于幾何空間構象的化合物表征模型HelixGEM,端到端的單序列蛋白結構預測模型HelixFold-Single等,大幅提升了新藥研發(fā)和疫苗設計效率,助力科技抗疫。
6.面向自動駕駛的車路協(xié)同關鍵技術
該項發(fā)明構建了車路協(xié)同自動駕駛的復雜技術體系與融合協(xié)同機制,通過協(xié)同感知,解決自動駕駛動靜態(tài)盲區(qū)、超視距、遮擋等一系列感知長尾問題,通過協(xié)同決策規(guī)劃和協(xié)同控制解決混行狀態(tài)下的現實變更、博弈、阻塞和極端場景等問題,降低自動駕駛的接管次數和安全事故風險,保障自動駕駛安全連續(xù)運行。
7.全平臺量子軟硬一體
該發(fā)明圍繞“量羲”布局,“量羲”是百度推出的基于“乾始”研發(fā)的全球首個全平臺量子軟硬一體化解決方案,提供私有化部署、云服務、硬件接入等一系列服務,最大程度上簡化了量子硬件部署到量子服務的全流程。“量羲”具備適配超導、離子阱等多類型主流量子芯片,可實現量子芯片“即插即用”。
8.數字人智能化生產
該發(fā)明基于語音、語義和視覺等AI技術,以智能終端為載體,實現人機可視化語音交互服務。借助百度智能云曦靈平臺,打通數字人生產、人設管理、內容創(chuàng)作到業(yè)務編排全流程。結合UNIT7.0跨模態(tài)對話引擎及AIGC技術,支持服務型和演藝型數字人多種人像(2D、3D、卡通)高效生產及運營。
9.智慧城市全要素雙總線技術
該發(fā)明的全要素雙總線包含智慧總線與知識總線,智慧總線構建城市服務的全資源協(xié)同開發(fā)與運行環(huán)境,統(tǒng)一納管調度城市中的各類數據、算法、算力,為智能化應用開發(fā)提供綜合技術供應;知識總線依托文心增強的城市多模態(tài)大模型及知識圖譜、NLP等AI技術,搭建城市全要素融合知識圖譜,支撐跨部門、跨應用、跨數據間的知識體系打通和資源共用。
10.自動駕駛多模態(tài)行人運動預測
該發(fā)明提出一種融合多模態(tài)輸入特征以及多維度交互模式的深度學習模型,用于預測行人未來6s的運動軌跡,已在Robotaxi業(yè)務中落地應用,行人預測準召提升30%,VRU碰撞風險問題解決率95%。