自己対局で囲碁AI大進化 棋士破ったアルファ碁

 米グーグル傘下の人工知能(AI)開発ベンチャー、英ディープマインド社は18日までに、最新作の囲碁ソフト「アルファ碁ゼロ」を開発した。自己対局を繰り返す学習方法を取り入れ、わずか3日間の訓練だけで、トップクラスの棋士を破った旧作ソフト「アルファ碁」に100戦全勝した。

 旧作ソフトは、棋士の対局データなど「先人の知恵」を活用した学習方法。最新作では、囲碁のルールを教えられたコンピューターがひたすら自己対局を繰り返し、勝つ可能性の高い手を学ぶ「強化学習」に特化したのがポイントだ。

 膨大な対局データが不要でソフトも単純化できる。数カ月かかっていた訓練期間も短縮できた。

 アルファ碁は昨年、世界トップクラスの韓国人プロ棋士らを相手に勝利。その後も進化を続け、今年、世界最強とされる中国人棋士にも勝った。

 「ゼロ」は、トップクラスの韓国人棋士に勝った旧作ソフトとの対局前に、3日間で約500万回の自己対局を繰り返した。(共同)