21世紀經(jīng)濟報道記者白楊 北京報道
過去幾年,有著數(shù)十年歷史的人工智能駛?cè)肓税l(fā)展快車道,尤其是2016年,谷歌AlphaGo與人類圍棋冠軍李世石進行的人機大戰(zhàn),更是引爆了全社會對人工智能的關注。
從技術角度,人工智能確實取得了跨越式的發(fā)展。隨著計算機軟硬件能力的提升,機器學習、計算機視覺等人工智能領域的基礎應用已變得十分成熟,比如現(xiàn)在,人們可以隨意列舉出很多生活中應用了AI的場景。
但是,狂奔之后,人工智能的腳步也開始放慢。一位AI創(chuàng)業(yè)者曾向記者表示,“當人們正欣喜于人工智能技術已經(jīng)發(fā)展到99%的進度時,突然發(fā)現(xiàn)剩下的1%又是一段全新的從1到100的過程”。
這意味著,在縱向上,人工智能技術的迭代將變得越發(fā)緩慢,然而在橫向上,基于已經(jīng)成熟的技術能力,人工智能的行業(yè)應用則將迎來爆發(fā)。
上個月,科技部等六部門聯(lián)合發(fā)布了《關于加快場景創(chuàng)新 以人工智能高水平應用促進經(jīng)濟高質(zhì)量發(fā)展的指導意見》,提出場景創(chuàng)新成為人工智能技術升級、產(chǎn)業(yè)增長的新路徑,場景創(chuàng)新成果持續(xù)涌現(xiàn),將推動新一代人工智能發(fā)展水平。
近日,騰訊云副總裁、騰訊優(yōu)圖實驗室總經(jīng)理吳運聲在接受21世紀經(jīng)濟報道記者采訪時也表示,近年來,隨著數(shù)字技術與實體經(jīng)濟加速融合,人工智能的發(fā)展不再局限于算力、算法、數(shù)據(jù)等方面的技術突破,而是從行業(yè)應用、社會需求的角度逐漸深入,展開一場“雙向奔赴”的范式變革。
從圖像識別到元素識別
優(yōu)圖實驗室成立于2012年,是騰訊旗下的人工智能實驗室,主要聚焦于計算機視覺。
吳運聲告訴記者,優(yōu)圖實驗室在成立之初就強調(diào),不只做基礎研究,而是要堅持研究和產(chǎn)業(yè)落地兩條腿并行的策略。
“一方面,我們作為技術研究的團隊,會堅持在技術方面做研究,為長期的發(fā)展做準備;另一方面,我們則會更緊密地跟行業(yè)去結合,把技術應用到行業(yè)中,產(chǎn)生實際的價值”,吳運聲說。
其中在技術研究方面,據(jù)吳運聲透露,相較之前比較基礎的圖像識別技術,優(yōu)圖實驗室正在研究一個新課題,即“元素識別”。
其舉例說,過去要識別一個訪談場景,會先搜集上千張各種各樣的訪談照片,然后拿給模型去訓練,并將這些照片標注為“訪談”。與此同時,還要搜集一些副樣本,這些樣本會和訪談場景有點類似以及完全不像,然后要把這些照片標注為“非訪談”。
“通過這樣的分類訓練,機器就能夠識別出一個場景是不是訪談”,吳運聲說,但是,隨著各類場景的增多,這種分類訓練的方式也變得十分低效。所以,優(yōu)圖實驗室希望通過對場景中元素的識別,進而實現(xiàn)對場景的識別。
同樣是訪談場景,在元素識別技術下,機器會先識別出人、沙發(fā)等元素,然后基于提前定義好的元素與元素之間的關系,如人坐在沙發(fā)上、人與人要面對面等,去識別該場景是不是訪談。
吳運聲說,“我們通過構建知識圖譜、訓練大模型等方式,從‘萬物識別’進入了‘萬物感知’。但僅有‘感知’仍然不夠,只有將時間、地點、人物關系串聯(lián),從單一要素識別晉升為對全場景的分析、處理,AI才能更好地理解和學習人類世界的真實狀態(tài)”。
通過對元素間的關系進行聯(lián)合建模,人工智能便能輸出符合人類經(jīng)驗的認知關系。而這,也將是計算機視覺領域未來發(fā)展的一個重要趨勢。
“場景”推動技術演進
在研究的另一側(cè)產(chǎn)業(yè)落地方面,優(yōu)圖實驗室的AI技術目前已經(jīng)落地到工業(yè)、金融、傳媒、政務、能源等行業(yè)。
吳運聲告訴記者,因為要產(chǎn)業(yè)落地,所以在優(yōu)圖實驗室,做研究的技術人員也要更深入地了解行業(yè)。以其自身為例,他除了擔任優(yōu)圖實驗室總經(jīng)理外,同時還兼任騰訊CSIG政企業(yè)務線產(chǎn)研負責人。
今年7月,騰訊云與智慧產(chǎn)業(yè)事業(yè)群(CSIG)正式成立政企業(yè)務線,該業(yè)務線涵蓋政務、工業(yè)、能源、文旅、農(nóng)業(yè)、地產(chǎn)、體育、運營商等多個領域。
“通過與這些行業(yè)的接觸,讓我們做技術的人也能了解到行業(yè)真實的需求,因此在做技術研發(fā)時,也更清楚什么樣的技術更貼合行業(yè)”,吳運聲表示。
比如去年,騰訊云與立鎧精密達成合作,在了解到對方存在“硬件缺陷多樣、成像復雜”等質(zhì)檢難題后,優(yōu)圖實驗室便有針對性地開展了算法研究。
針對工業(yè)場景缺陷樣本少、缺陷噪音多、產(chǎn)品型號廣等問題,優(yōu)圖實驗室通過小樣本學習、域遷移學習、帶噪學習和模板學習等方法提升了算法的魯棒性與泛化性。最終,立鎧精密用AI替代了原有的目視檢測,并且漏檢率接近于0。
在與交通銀行的合作中,優(yōu)圖實驗室通過將多模態(tài)應用于計算機視覺研究,為交通銀行提供了多個場景下的視覺AI解決方案,并利用圖像技術解決了用戶上傳圖片不清晰、資料印章模糊干擾、用戶證件PS鑒偽等問題。
吳運聲表示,依據(jù)場景而來的技術演進,是人工智能的生命來源。“我們把一項項‘不可能’的技術,通過創(chuàng)新場景落地應用,同時,也利用‘場景’為人工智能持續(xù)注入生命力,推動技術不斷迭代”。
在數(shù)字經(jīng)濟時代,數(shù)字技術與實體經(jīng)濟共生共榮,而人工智能扮演的是基礎設施的角色。在吳運聲看來,數(shù)實融合的過程中,產(chǎn)業(yè)是機體,技術是大腦,商業(yè)是神經(jīng),只有將各環(huán)節(jié)要素結合在一起,才能更好發(fā)揮人工智能的價值,從而推動中國產(chǎn)業(yè)的升級發(fā)展。