深·觀察深·觀察

智能刷臉，打開新“視界”

2017年12月04日 09:07 | 來源：人民日報

分享到：

不久前,在2017年美國國家標準與技術(shù)研究院組織的全球人臉識別技術(shù)測試上,一支中國人工智能技術(shù)團隊超過來自俄羅斯、美國、法國的對手,成為第一個獲得冠軍的中國團隊。

網(wǎng)絡圖

參賽團隊需要在百萬量級人臉數(shù)據(jù)庫中找到目標人臉或判斷其在不在庫中。查詢照片來自出入境等真實業(yè)務場景,包含識別對象不在攝像頭前特定位置的“非配合性”照片。機器面臨曝光過度、逆光、側(cè)臉、遠距離、低像素的挑戰(zhàn)。衡量指標在于搜索的準確率,以千萬分之一誤報率下的性能為評估標準。檢索準確率越高,就意味著參賽者的算法可以在更大規(guī)模的人臉數(shù)據(jù)庫中獲得可靠檢索結(jié)果,可以更準確、高效地完成身份驗證。

贏得冠軍的中國團隊——依圖科技的首席執(zhí)行官朱瓏認為,這除了說明來自中國的算法技術(shù)超過了全球的競爭對手,還有更大的意義:我們的算法已經(jīng)在十億分之一的誤報下達到超過90%的識別率,已經(jīng)能夠超越所謂的國際主流標準。

人臉識別就是科學家口中的計算機視覺,作為人工智能極其重要和關(guān)鍵的領(lǐng)域,目前正處在超乎想象的快速發(fā)展階段。“從我們自己的經(jīng)驗看,我們的算法效率幾乎以每年100倍的速度在提高。現(xiàn)在在幾億量級的面孔中識別出一個人,并不是什么難事。”之前,依圖科技搭建了全球首個10億級人像比對系統(tǒng)。

朱瓏說,簡單講,計算機視覺是制造有人類視覺能力的機器,讓計算機通過學習算法接近人類對圖像的理解程度。而當計算機實現(xiàn)了對圖像和視頻的初始理解,計算機視覺就能幫助人類突破局限性,改善生活。例如,目前依圖的主要技術(shù)聚焦在計算圖像識別和自然語言理解在安防、醫(yī)療、金融領(lǐng)域的應用,同時也在進行人機交互、人工智能芯片等研發(fā)。

不同于計算機,人一睜眼就能迅速看到和看明白一個場景,因為人的大腦皮層至少有一半以上的海量神經(jīng)元參與了視覺任務的完成。在互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等幫助下,科學家們也開始利用深度學習、神經(jīng)網(wǎng)絡等模型和方式來教會計算機識別物體。有意思的是,盡管人類希望計算機視覺接近人類智慧,但在很多場合特別是機器得到海量數(shù)據(jù)的學習訓練后,科學家們發(fā)現(xiàn)計算機視覺處理能力似乎已經(jīng)超越了人類大腦。

“計算機識別人臉和物體的時候,有點像從人眼看見物體到大腦譯出最終結(jié)果的過程。我們的計算模型也類似人的神經(jīng)元傳遞方式,一層一層搭建起高級的神經(jīng)網(wǎng)絡。”朱瓏和導師、著名科學家霍金的弟子艾倫·尤爾,最早在實驗室中研發(fā)出新系統(tǒng),通過遞歸式塔狀結(jié)構(gòu)來表示物體的結(jié)構(gòu),而不是像傳統(tǒng)識別方式那樣,需要事先被告知物體特征,從而會導致巨大的數(shù)據(jù)存儲量。朱瓏認為,技術(shù)人才的儲備、市場環(huán)境的成熟和實踐的基礎(chǔ)、數(shù)據(jù)資源,是中國人工智能可以和全球最強對手競爭的巨大優(yōu)勢。無論是對國家還是從業(yè)者而言,人工智能都將迎來極其難得的機遇。

編輯：劉小源

關(guān)鍵詞：計算機識別視覺人類