訊息訊息

人工智能畫(huà)畫(huà) 是深夢(mèng)還是噩夢(mèng)

2017年09月21日 17:35 | 來(lái)源：虎嘯

分享到：

提到谷歌的人工智能，大家想到的大多是會(huì)下棋的阿爾法狗和Waymo無(wú)人車(chē)。可要我說(shuō)，谷歌對(duì)于教人工智能畫(huà)畫(huà)這件事，好像有種特別的執(zhí)念。

今年，谷歌推出了一款可以幫助人畫(huà)簡(jiǎn)筆畫(huà)的工具Autodraw，隨便畫(huà)幾筆，算法就能識(shí)別出你想要畫(huà)什么圖案，為你優(yōu)化出來(lái)。其實(shí)這并不是谷歌推出的第一個(gè)人工智能+繪畫(huà)項(xiàng)目，早從2015年開(kāi)始，谷歌就已經(jīng)在用算法挑戰(zhàn)人類(lèi)對(duì)藝術(shù)的認(rèn)識(shí)和審美了。

DeepDream：是深夢(mèng)還是噩夢(mèng)？

谷歌不僅僅有DeepMind，還有DeepDream——利用深度學(xué)習(xí)技術(shù)識(shí)別圖片，再把自己解讀的畫(huà)面呈現(xiàn)出來(lái)。后來(lái)谷歌將這一項(xiàng)目開(kāi)源，讓所有人都可以上傳圖片，再生產(chǎn)出被DeepDream解讀的結(jié)果。

不知道是不是在訓(xùn)練是被喂了太多眼睛和小狗的圖案，反正經(jīng)過(guò)DeepDream加工過(guò)的圖片基本都是這樣……

充滿(mǎn)了狗臉、眼睛、詭異的螺旋圖案，有種異樣的魔性。谷歌甚至還為DeepDream舉辦過(guò)一次展覽，展出的六幅作品還被一位收藏家拍了下來(lái)，最高單幅價(jià)格高達(dá) 8000 美元。這可能是第一位靠“藝術(shù)”賺錢(qián)的人工智能了。

實(shí)際上，谷歌DeepDream真正想要了解的，是神經(jīng)網(wǎng)絡(luò)黑盒子的工作邏輯。我們都知道，神經(jīng)網(wǎng)絡(luò)在識(shí)別圖像時(shí)通常是層數(shù)越多、越細(xì)致，第一層神經(jīng)網(wǎng)絡(luò)可能在識(shí)別輪廓，中間層的神經(jīng)網(wǎng)絡(luò)可能就在識(shí)別紋理、筆觸等等細(xì)節(jié)了。我們看到的那些正確識(shí)別出圖像的算法，都是經(jīng)由人工調(diào)試后的，而DeepDream則跳過(guò)了人工指導(dǎo)、矯正這一步，直接憑著自己的意愿識(shí)別圖片，并且會(huì)經(jīng)過(guò)數(shù)次重復(fù)，最終就成了我們現(xiàn)在看到的樣子。

和上圖一樣，如果讓我們把樹(shù)看成建筑，把植物看成鳥(niǎo)，恐怕只能去發(fā)揮想象力了。這種機(jī)器識(shí)別出人眼不能識(shí)別的圖案的情況，讓我們?cè)僖淮伍_(kāi)始思考機(jī)器視覺(jué)和人類(lèi)視覺(jué)的不同。或許，DeepDream真的是一個(gè)有著無(wú)限想象力的嬰兒人工智能，把人類(lèi)世界里的一切都看做它可愛(ài)的寵物狗。

Quick，Draw！來(lái)和人工智能玩你畫(huà)我猜

很快，谷歌就不再止步于只讓人工智能畫(huà)狗臉了。在去年，谷歌推出了一款叫Quick， Draw！的繪畫(huà)小程序。Quick， Draw！其實(shí)就是人與人工智能合作的“你畫(huà)我猜”，系統(tǒng)隨機(jī)顯示一個(gè)名詞，要求用戶(hù)在20秒內(nèi)把它畫(huà)出來(lái)。用戶(hù)用鼠標(biāo)簡(jiǎn)單畫(huà)出物體形狀后，然后 Quick， Draw！會(huì)判斷你畫(huà)的到底像不像，并且會(huì)顯示出除了題目之外，你的畫(huà)還像什么其他的東西。

顯然，這是一個(gè)收集數(shù)據(jù)的好方法。僅僅半年的時(shí)間，就有來(lái)自 100 個(gè)國(guó)家的 2000 萬(wàn)用戶(hù)，在 Quick， Draw！上共繪制了 8 億幅涂鴉。谷歌還表示，這些數(shù)據(jù)了反映的不同文化背景與觀念，比如不同國(guó)家的人所畫(huà)的椅子是不一樣的，有些國(guó)家人畫(huà)的椅子總是側(cè)面，有些則通常是正面。現(xiàn)在，谷歌已經(jīng)開(kāi)放了其中的部分?jǐn)?shù)據(jù)，供所有開(kāi)發(fā)者一起玩耍。

Autodraw：人工智能涂鴉大師

文章開(kāi)頭提到的Auto draw就是Quick，Draw！數(shù)據(jù)的研究成果，也展示了谷歌強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù)。

Autodraw能做到的不僅僅是識(shí)別你在畫(huà)什么，它甚至能幫你補(bǔ)完未完成的涂鴉，糾正其中的錯(cuò)：如果你花了一只三只眼睛的貓，Autodraw會(huì)去掉一只眼睛。

這意味著，Autodraw已經(jīng)擁有了我們所說(shuō)的抽象思維，它并非僅僅是按照歷史數(shù)據(jù)規(guī)整圖畫(huà)的線(xiàn)條，而是“知道”眼睛這一概念，并且知道貓只有兩只眼睛。

Autodraw的背后，是人工智能系統(tǒng)SketchRNN。當(dāng)我們?cè)赒uick，Draw！上作畫(huà)時(shí)，SketchRNN會(huì)記下我們每一筆的形狀和順序，為每一種特定物體（貓、椅子等等）訓(xùn)練出一種神經(jīng)網(wǎng)絡(luò)。

把人類(lèi)涂鴉的筆畫(huà)當(dāng)成輸入，進(jìn)行序列編碼，用人們的繪畫(huà)方式來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。完成這一訓(xùn)練后，SketchRNN就了解了某一圖案繪畫(huà)時(shí)的“一般規(guī)則”。

比如我們畫(huà)貓時(shí)，會(huì)畫(huà)一張圓臉，兩個(gè)尖耳朵，兩只眼睛，六根胡須。SketchRNN就能明白，一個(gè)大圓、兩個(gè)小圓、六根線(xiàn)和兩個(gè)尖角加起來(lái)就是“貓”。然后，再向其中引入變量，讓SketchRNN可以輸出和接受隨機(jī)性。比如貓臉的圓形可以不那么圓，貓的胡須可以長(zhǎng)短不齊。但是三只眼睛這種錯(cuò)誤超過(guò)了變量浮動(dòng)的范圍，是會(huì)被SketchRNN修正的。

和上圖一樣，同樣是汽車(chē)，顏色越偏暖的圖案，代表隨機(jī)性越大，而這些全都是SketchRNN的作品。

SketchRNN雖然神奇，可很多人認(rèn)為這項(xiàng)技術(shù)的實(shí)用性比較差。因?yàn)镾ketchRNN能識(shí)別甚至創(chuàng)造圖形的原因，是因?yàn)閳F(tuán)隊(duì)為每一種圖案都訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)。能做到這些，離不開(kāi)Quick，Draw！收集到的龐大數(shù)據(jù)量，更離不開(kāi)TensorFlow的強(qiáng)大算力。可動(dòng)用了如此之多的資源之后，SketchRNN的應(yīng)用范圍還只限制于涂鴉之中，如果圈定在“筆畫(huà)”這個(gè)邏輯里，或許以后還能在書(shū)法上有所作為，但效率如果還停留在每個(gè)個(gè)字搭建一個(gè)神經(jīng)網(wǎng)絡(luò)上，性?xún)r(jià)比未免太低了。

不過(guò)也有人提出了其他的看法，有學(xué)者認(rèn)為，“筆畫(huà)”是世界范圍共用的溝通方式。象形文字、壁刻畫(huà)式的線(xiàn)條會(huì)對(duì)人類(lèi)大腦形成一種天然的刺激，人類(lèi)的藝術(shù)創(chuàng)造越來(lái)越具象，或許展示了一種大腦和思維進(jìn)化的可能。按照這個(gè)邏輯，SketchRNN或許能為我們找回曾經(jīng)的思維方式，在未來(lái)幫助考古、史學(xué)、人類(lèi)學(xué)等等領(lǐng)域更好的進(jìn)行研究。

編輯：楊嵐

關(guān)鍵詞：人工智能畫(huà)畫(huà) 谷歌DeepDream