首頁>要聞>悅讀 悅讀
為什么說AlphaGo的勝利是件驚天動地的大事?
“國際象棋和西洋棋與圍棋不同,它們不需要選手對棋局做復雜的形勢評估,”喬納森·謝弗(Jonathan Schaeffer)說道,他是加拿大阿爾伯塔大學的計算機科學家,此前他的Chinook程序曾戰勝過頂級的西洋棋選手。“在國際象棋和西洋棋中,只需簡單的啟發,你就知道下一步該怎么走,衡量各個棋子的價值是選手最重要的任務——如果在國際象棋中多一個車的棋子,那你已經基本勝券在握了。但這些方式在圍棋中都行不通,從人類的角度來看,圍棋的棋路過于復雜,電腦很難學會。不過AlphaGo做到了,它擁有世界上首個有效的評估函數系統。
那么DeepMind是如何做到的呢?其實解決這個問題的關鍵是深度學習和類神經網絡技術,有了它們,研究人員就能教AlphaGo下棋。就像Google Photos能幫你從無數圖片中找出貓咪一樣,其背后是該應用對超大量級的貓咪圖片做分析后的結果,這些分析處理甚至細化到了像素級別。而AlphaGo能有如此成績,則得益于對數百萬項圍棋數據的學習,包括各種棋路和棋手的比賽。
眼下,AlphaGo還在不斷學習,其能力也在不斷增強。起初,它還是靠學習套路(策略網絡)來預測對手的落子方式,不過隨著價值網絡訓練的深入,AlphaGo已經有了那么點“直覺”,它可以分析出比賽的態勢了。在棋局中,AlphaGo已經可以通過快速對各種可能性做分析,提前考慮后面幾步的落子和排兵布陣了。其實AlphaGo擁有的各項技術都是相互輔助的,類神經網絡可以降低電腦的負載,提高工作效率;套路學習則可以減小其搜索范圍,而價值網絡則可讓它從每次的比賽中總結出自己的經驗。
AlphaGo擁有自己的“思考”能力
這一增強版的學習系統讓AlphaGo變得更像人類,而不是靠驚人計算能力戰勝國際象棋大師的IBM深藍電腦,畢竟圍棋和國際象棋在復雜程度上不屬于一個量級,用深藍電腦的方法是無法在圍棋上戰勝人類的。在五場比賽的間歇,DeepMind都不會對AlphaGo做調整,因此電腦只能靠自己來學習,但每天一場比賽的量確實有些少。此外,DeepMind公司創始人杰米斯?哈薩比斯(Demis Hassabis)稱AlphaGo的計算能力在去年十月的比賽后一直都沒有得到增強,因此現在它的能力已經達到現有硬件條件下的頂峰。
編輯:薛曉鈺
關鍵詞:AlphaGo 李世石 尾氣