經(jīng)濟觀察網(wǎng) 記者 任曉寧9月3日,2022世界人工智能大會期間,騰訊優(yōu)圖實驗室總經(jīng)理吳運聲向經(jīng)濟觀察網(wǎng)記者介紹了騰訊在AI視覺領(lǐng)域的最新進展。以前,AI識別需要標(biāo)注幾千張圖片,訓(xùn)練之后才能做出識別,F(xiàn)在,小樣本或者無樣本標(biāo)注,AI也能做到90%成功率的識別。
優(yōu)圖是騰訊位于上海的AI實驗室,主要側(cè)重人工智能視覺領(lǐng)域。在小樣本識別方面,目前優(yōu)圖已經(jīng)有了成功案例,其和交通銀行一起研究AI識別單據(jù)的模型,用5張樣本訓(xùn)練,可以做到90%準確率。
現(xiàn)在之所以能做到小樣本識別,是因為使用了不同的AI訓(xùn)練邏輯。以前的AI識別模型是用大量的數(shù)據(jù)“喂”出來的,一個場景至少需要標(biāo)注并訓(xùn)練幾千張圖片,F(xiàn)在的邏輯是,從人的角度去理解一個場景,比如識別一個釣魚的場景,不再先標(biāo)注幾千張釣魚的照片讓AI學(xué)習(xí),而是定義了一個邏輯:當(dāng)有水面,有人,有桿子,桿子上有一條線時,很可能就是一個人在釣魚。
“過去我們面臨的主要課題是如何把相對標(biāo)準化的功能做好,比如文字識別、車牌號識別,如今這些基礎(chǔ)的辨識工作,AI早已輕車熟路。一個新的課題是如何解決大量非標(biāo)準化的中長尾功能,邁向更加豐富、更加細粒度的元素識別時代。”吳運聲告訴記者。小樣本或無樣本識別的主要價值在于節(jié)省工作量。當(dāng)常見的標(biāo)準化場景已基本識別完畢后,非標(biāo)準的場景可能還有幾百萬種,如果按照之前的訓(xùn)練方式,龐大的工作量是很難完成的。并且,隨著場景深入,AI需要識別更加細致的內(nèi)容,比如以前只能識別人臉,之后人體的每一部分,眉毛、眼睛、嘴巴都需要識別,這些工作量也很龐大。
騰訊優(yōu)圖實驗室成立于2012年,吳運聲在實驗室成立之初就擔(dān)任負責(zé)人,從零開始搭起了優(yōu)圖實驗室。他告訴記者,今年他的工作角色有了一些變化,之前他只負責(zé)算法等技術(shù)研究,現(xiàn)在則兼任政企業(yè)務(wù)線產(chǎn)研負責(zé)人,更深入地接觸工業(yè)、能源、運營商、文旅、地產(chǎn)等產(chǎn)業(yè),打磨AI落地的場景。
吳運聲也介紹了去年至今騰訊優(yōu)圖AI落地的情況。在工業(yè)領(lǐng)域,去年,騰訊與立鎧精密達成合作,在了解到立鎧精密存在“硬件缺陷多樣、成像復(fù)雜”等質(zhì)檢難題后,優(yōu)圖自研了AI質(zhì)檢算法,解決了人工目視質(zhì)檢的難題,實現(xiàn)漏檢率接近于0,立鎧精密每年可節(jié)省超千萬的支出。在金融、傳媒等行業(yè),優(yōu)圖的AI技術(shù)也加快了落地。