“深度學習”算法讓機器像嬰兒一樣學習視覺世界

2016年12月19日15:07  來源:新華社
 
原標題:新算法讓機器像嬰兒一樣學習視覺世界

  新華社洛杉磯12月18日電 美國科學家日前報告說,他們從人類大腦的學習方式中獲得靈感,研發出一種新的“深度學習”算法,可以讓機器像人類嬰兒一樣自主學習視覺世界。

  在深度學習領域,科學家喜歡用“這是1,這是2”的方法來訓練機器。這種被稱為“監督學習”的技術,在訓練時需要為機器提供成千上萬標記好的樣本,此前被認為是最有效的方法。

  不過,人類並不是這樣學習。在大多數情況下,人類大腦的學習方式都是“無監督學習”。在日前於西班牙巴塞羅那舉行的神經信息處理系統(NIPS)大會上,研究人員發表報告說,美國賴斯大學和貝勒醫學院的神經科學和人工智能專家研發出一種“半監督學習”算法,這種機器學習方式與人類更為接近。

  研究負責人安基特·帕特爾解釋說,嬰兒出生第一年,父母會告訴孩子這是水瓶、椅子、媽媽等,但事實上,嬰兒並不能理解這些詞語的意思。多數情況下,他們是通過與世界互動進行“無監督學習”的。

  據介紹,研究人員首先僅向新研發出的“深度渲染混合模型”提供從0到9這10個數字的10個手寫標准樣本,然后再讓模型去“自學”數千個樣本數據,通過這種“半監督學習”算法讓模型學習識別手寫體數字。最終測試結果顯示,在辨別手寫數字方面,這種模型比此前幾乎所有算法,即一開始就通過數千個正確樣本訓練機器“學習”每個數字的方法更為准確。

  研究人員表示,這種“半監督學習”算法屬於一種“卷積神經網絡”。在這種從生物神經元中得到啟發而設計出的多層人工神經元網絡中,人工神經元(或稱數據處理單元)分層排列。第一層掃描圖像,並執行相對簡單的任務,如搜索邊緣和顏色的變化等。第二層負責檢查從第一層輸出的內容,並搜索更復雜的模式。從數學角度上說,這種在模式內尋找模式的嵌套方法被稱為一種非線性過程。

  研究人員指出,從本質上說,卷積神經網絡是一個“非常簡單的視覺皮層”。舉例來說,如果給這個網絡輸入一個圖像,那麼它的每一層就會處理這個圖像的一部分特征,而隨著層級深入,對於圖像的理解也就不斷加深。到最后一層,這個網絡就會獲得關於這個圖像相當深入且抽象的理解。事實上,現今幾乎所有自動駕駛系統都配備了這種網絡,因為卷積神經網絡是迄今最好的視覺處理方法。

  研究人員認為,他們研發出的這種人工神經網絡還可以幫助神經科學家更好地了解人類大腦處理信息的方式,因為人類大腦的“算法”遠遠優於任何人類設計的神經網絡。(記者 郭爽)

(責編:趙鵬(實習生)、姚欣雨)