AlphaZero: Shedding new light on the grand games of chess, shogi and Go | DeepMind
https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/
囲碁チャンピオンを打ち負かしたソフト「AlphaGo」は、自分で自分を鍛えられる「AlphaGo Zero」へと進化しました。自分と戦いつつ実力をメキメキ向上させられるため、自己学習可能なAlphaGo Zeroでは人間の関与が不要になりました。
囲碁に特化していたAlphaGo Zeroは、あらゆるボードゲームに対応できる汎用性を持つ「AlphaZero」へと進化しました。
そして、DeepMindによって2018年12月7日にScienceで発表された論文では、AlphaZeroが、チェス・将棋・囲碁の3つの代表的なボードゲームにおいて、これまでに開発された最強のソフトウェアを数日で打ち負かす能力に成長できることが明らかにされました。
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play | Science
http://science.sciencemag.org/content/362/6419/1140
https://i.gzn.jp/img/2017/10/20/alphago-zero/00.jpg
2016年に開催されたチェスプログラムの世界大会TCECシーズン9を制した「Stockfish」とのイロレーティングの比較。AlphZeroは自己学習開始から4時間でStockfishを上回りました。
https://i.gzn.jp/img/2018/12/07/alphazero/a02_m.png
将棋のチャンピオンソフト「elmo」との対決では、2時間後にはAlphaZeroが上回ったとのこと。
https://i.gzn.jp/img/2018/12/07/alphazero/a01_m.png
囲碁チャンピオンのイ・セドルに勝ったときのAlphaGoを、たった30時間で超えました。
https://i.gzn.jp/img/2018/12/07/alphazero/a03_m.png
続きはソースで
AlphaZero: Shedding new light on the grand games of chess, shogi and Go https://youtu.be/7L2sUGcOgh0
引用元: ・囲碁王者を倒したAlphaGoをゼロから始めて30時間で打ち負かす「AlphaZero」、将棋・チェスの最強ソフトもサクッと制圧[12/07]
続きを読む
Source: 理系にゅーす