11月28日消息,不久之前,人們認為圖像識別將會是另一個引領未來之浪潮,如今這樣的想法已經不常見了。但是現(xiàn)在,由于拍攝及存儲的照片之規(guī)模愈發(fā)龐大,而且又需要即快且易地找到它們,攝影技術便把圖像識別技術推到了發(fā)展之前沿,舞臺的中心。而且隨著技術不斷進步,圖像識別技術也加入了其他技術來鞏固搜索運算和搜索結果。
近日,雅虎旗下的Flickr以及實驗室小組利用一個多元合一策略,把計算機視覺、地理信息以及人際互動結合在一起,擺脫了對元數據的依賴,從而已經發(fā)展出了一套可行的搜索算法。開發(fā)這一技術的初衷是,幫助優(yōu)化Flickr照片軟件以及為照片軟件的用戶服務,同時也著眼于雅虎軟件和電子商務服務的當前及未來之商業(yè)需求。
雅虎天氣軟件為試驗這一技術提供了一個好機會。該軟件搜集元數據、地理位置以及人們對Flickr照片的互動,以為該軟件選擇那些最有趣味的圖片。雅虎實驗室的高級科研主管David表示,“天氣軟件是一個很好的例子,因為它涉及到很多照片,而且我們可以在不同的地理位置檢索這些圖片,不僅檢索地理坐標,而且檢索時間和天氣狀況,然后再把這些圖片還原到軟件中,從而發(fā)現(xiàn)你喜歡什么樣的城市風貌。”雅虎沒有完全依賴于諸如標簽、照片名稱等來自于用戶的內容,而且借助于計算機視覺和深度學習技術來識別圖片上的物體。計算機視覺和社會視覺的結合增強了搜索結果的質量。
社會計算方法產生出了大約600萬張?zhí)鞖鈭D片。經過對不準確的地理位置和時間、低分辨率以及錯誤內容的修正,大約有150萬張照片保留在了天氣軟件上。“這一方法加強了人工智能,而且加入人的因素,”雅虎實驗室的高級研究科學家Jia Li說。“基于深度學習,照片歸類算法分析一張照片到底是暴風圖、多云圖還是雪景圖,是白天還是黑夜。”
這并非Flickr第一次公開分析其圖像識別技術進展的細枝末節(jié)。另一個最近的博客帖子也描述了該小組正在嘗試改善圖片搜索以及圖片尋找技術。雅虎和Flickr把社會計算(social computing)、地理方位以及電腦視覺融合起來,推動圖像識別技術的發(fā)展。雅虎也加入其它公司共同研發(fā)圖像識別技術,分享自己搜集的一億多張照片來提供足夠多的數據供研究人員使用。
最終,圖片識別技術成熟之時,會有助于提高改善人們的私生活。Garrigues說,“圖像識別還沒有怎么影響到尋常百姓的生活。我手機上有一萬張照片,而且我需要花很多時間來滑動屏幕,但還是找不到想要的照片。我們認為,在把這一技術帶給人們以及讓它幫助人們改善生活上,還缺少一環(huán)。”