站長(zhǎng)之家(Chinaz.com)注:在完虐李世石和“圍棋第一人”柯潔之后,阿爾法狗再進(jìn)化,已經(jīng)可以自我對(duì)弈進(jìn)行學(xué)習(xí),,只進(jìn)行了 3 天的訓(xùn)練就擊敗了舊版的阿爾法狗。
日前,谷歌旗下人工智能研究部門DeepMind發(fā)布了新版AlphaGo系統(tǒng):AlphaGo Zero。據(jù)介紹這套系統(tǒng)開(kāi)始靠本身的能力學(xué)會(huì)圍棋中的一些高級(jí)概念。
那么AlphaGo Zero的下棋能力如何呢?其效果也是相當(dāng)?shù)捏@人,經(jīng)過(guò) 3 天的訓(xùn)練后,這套系統(tǒng)已經(jīng)可以擊敗AlphaGo Lee,也就是去年擊敗韓國(guó)頂尖棋手李世石的那套系統(tǒng),并且比分高達(dá) 100 比0。經(jīng)過(guò) 40 天訓(xùn)練后,AlphaGo Zero已經(jīng)可以擊敗AlphaGo Master(也就是戰(zhàn)勝世界冠軍柯潔的系統(tǒng)),比分為 89 比11。
值得一提的是,本來(lái)的AlphaGo需要與人類進(jìn)行成千上萬(wàn)次對(duì)弈,才能從中獲取數(shù)據(jù),而Alphabet Zero卻能無(wú)師自通,通過(guò)自學(xué)使本身的游戲技能得以提高。
DeepMind研究人員在其論文中所總結(jié)道:“我們的研究結(jié)果全面展示了即使在最具挑戰(zhàn)性的領(lǐng)域,純粹的強(qiáng)化學(xué)習(xí)方法也是完全可行的:不借助人類的示范或指導(dǎo),不消學(xué)習(xí)超越基本規(guī)則的知識(shí),就可以培養(yǎng)出超人?!?/p>
對(duì)此,不少網(wǎng)友體現(xiàn),看來(lái)以后人類被人工智能控制的情況太有可能發(fā)生了,想想就覺(jué)得可怕。你又是怎么看的呢?