2019年4月18日、世界一の囲碁AI(人工知能)の開発と若手棋士の育成を目指す「GLOBIS-AQZ」プロジェクトが立ち上がった。このニュースは、多くのメディアで取り上げられているため、ご覧いただいているかもしれない。

 一般の方にとって、囲碁というと難しい印象があるが、使われるルールは5つとシンプルで、碁石は盤上のどこに置いてもよい、白と黒の碁石を使う陣地取りゲームである。
とはいえ奥深いゲームであることから、ゲームを楽しむために1回で理解するのは難しい。勝負中の優劣がわかりづらい、相手の打つ手の意図が分かりにくいなど、勝敗の見極めが難しいのが理由かもしれない。
つまりゲームの複雑さがある。ゲームの局面の総数で見ると、オセロで1028(10の28乗)、チェスで1050、将棋で1069と言われており、囲碁にいたっては、10220とも言われる。観測可能な宇宙の原子の総数約1080とも比較にならない。
このため、碁をコンピューターが打つとしても、そこまで複雑だと、勝負は、しばらく人間に分があると考えられていた。


「囲碁AI」開発の現状はどうなっているのか

1984年に、初めてのコンピュータ囲碁大会が開催されたものの、2014年12月の時点でもコンピュータが人に勝つのは10年後になるのではとの声があった。

 2016年、Google DeepMind社のAlphaGoがトップ騎士に勝ってから、状況は大きく変わることになる。
今や、多くのAIが人間を超えた実力となり、Facebook、WeChat(中国最大人気SNS)のTencent、精華大学(中国)など、多くのIT大手企業や学術機関などがチームを組んで開発し、世界大会で競争を繰り広げている。
特に中国での開発が盛んで、中国棋院と提携した中国のナショナルチームが開発したFineArt(以下、絶芸)が、第10回UAE杯コンピューター囲碁大会や2018テンセント囲碁AI世界大会で優勝しており、その後のAI 竜星戦 2018では、Golaxyが優勝している。
日本では、AI 竜星戦2017で準優勝した DeepZenGo Projectの終了が2018年3月に発表され、これに続く新規開発は少ない。
こうした競争では、サーバー(高価なコンピュータ)が多数用意できる資金があるチームが優勢に立つという感じが否めない。
 このような状況の中、2018テンセント囲碁AI世界大会で、準決勝で敗退したものの数々の強豪AIを倒し、そのあとの2018 中信証券杯 第2回世界電脳囲碁オープン戦では準優勝となった「AQ」という囲碁のソフトウェアを開発した、若き日本のエース 山口 祐氏(以下、山口氏)の姿があり、そのソフトを一人で頑張って開発してきたというのだから、驚愕である。

そもそも、なぜ囲碁なのか?

 すでに人間では勝てないレベルにまで囲碁AIは成長してきている。
人工知能の有用性が認められ、一定水準のレベルに達したことから、これ以上開発する必要はないという意見もある。

それでも山口氏が囲碁AIを開発しているのは、「囲碁は人間が作り出してきたボードゲームの中で一番複雑で奥深さを持っている。AI(人口知能)の深層強化学習という分野における一種のベンチマークと考えており、研究の題材テーマとしてかなり適している。」という考えからだ。

 一方、グロービスがなぜ囲碁なのかと言えば、グロービス経営大学院 堀学長(以下、堀代表)は、「織田信長がなぜ囲碁をたしなんでいたかを研究してみたかった。桶狭間の戦いでは立ったまま食事をしたというエピソードを残すほど、信長は非常にせっかちな人物ですが、なぜ囲碁は好きだったのか」というようなことから、40代で囲碁を学び始め、日本棋院の理事まで務めている。※1
そうした背景や、「経営の複雑性を排除すると、そこには囲碁盤が存在する」という堀氏の考えがあるからだ。

※1 囲碁に学んだ3つの経営の極意 グロービス堀学長 

 4月に発表されたプロジェクトは、2019年8月の「2019中信証券杯 第3回世界電脳囲碁オープン戦」で世界一を目指すことを区切りとしての目標に設定し、同時に若手囲碁棋士育成の取り組みも進めていく。


囲碁AIに必要な環境

 山口氏がこれまで囲碁で戦ってきた中で、苦労した点として計算資源(サーバー環境)と、人的資源を挙げている。

 最初は個人が買えるパソコンで開発してきたが、どうしても学習の時間が間に合わず、Amazon AWSなどのGPU(人工知能の学習のため行列演算が得意な素子)が使えるサーバーを自己資金で負担し利用してきたとのこと。継続して2年半くらい囲碁の開発に関わってきており、「クレジットカード限度額を超えることもあった」ともいう。敵となる中国のチームが、計算資源の確保のため、何百台ものサーバーを用意していることから、個人が、いくらお金をつぎ込んでも間に合わない。費用面で限界があるというのは、うなづける。

囲碁の学習に、例えば、GPUベースの並列コンピューティング機能を備えた「Amazon EC2 P2 インスタンス」を例にとるとp2.8xlargeで1時間7.200 USD。
仮に1ヶ月利用すると、$7.2 x 24h x 30dで、$5184(110円/$で57万円)となる。

 人的資源も、ほとんどがチームを組んでいることから、競争相手側は囲碁プログラムの分業が可能になり、ある人は主要な探索アルゴリズムを担当し、別の人は学習部分のサーバーへの振り分けや、インフラ周りなど、得意分野で分担できる。山口氏の場合、全部一人で行っているため、マンパワーが足りず、開発の時間がとりにくかったという。

 堀代表が中国の強豪AI「絶芸」の開発現場を訪れて刺激を受けたことで、山口氏に声がかかり、今回のプロジェクトがスタートしたのはちょうど良いタイミングである。
そして囲碁AIで世界4位になったことがあるトリプルアイズ※2の参画も得られ、さらには、日本棋院、東大 松尾研、産総研など話をすることで体制が整い、さらに世界と戦える産総研AI橋渡しクラウド「ABCI」※3を利用することが可能になり、こうして戦える環境が整うことになる。

※2 株式会社トリプルアイズ (代表、福原 智)
 囲碁AI「Raynz」を開発。囲碁AI国際大会 博思杯2019囲碁AI世界大会で世界4位。
※3 産業技術総合研究所AI橋渡しクラウド「ABCI」
 2018.6 スパコン性能ランキング世界5位、2018.11 性能指標(HPCG)において世界5位を達成

どのような仕組みで囲碁の学習を行っていくのか

 今回の「GLOBIS-AQZ」は、パラメータ学習(深く読んだ候補手と勝敗の学習)と自己対戦の分散・並列化システムを採用している。
並列化は、計算資源のスケーリング(規模拡大)となっている。産総研のもつ1088台の計算ノード(サーバー群)の一部を占有し、どのサーバーにどの計算をさせるか、また、どのように振り分けるかを考えて構築している。
サーバーとして利用する台数が増えることで、それに応じて効率よく学習できる手法である。

 サーバーは独立して計算することから、囲碁の場合だと、対戦棋譜をそれぞれのサーバーに振り分けることで、単純にサーバー台数の分、並列して学習ができる。
たとえば、オープニングと呼ばれる序盤定石というようなものを割り振ったり、多少のランダム性を増やすことで、各サーバーで計算の重複や無駄が、できる限り少なくなる仕組みである。

 実際のサーバー構成では、1~数台のパラメーターサーバーがあり、全体の管理とパラメーターの学習を行う。末端では、100台規模で自己対戦サーバーが存在する。
末端の自己対戦サーバーはパラメーターサーバーから最新のパラメーターを手に入れて、計算を繰り返す。学習した結果はパラメーターサーバーに送られ、どんどん新しいパラメータに更新していく。この一連の流れを、1サイクルとして、それを繰り返し強化学習していくのである。
局面データとか、この局面で、どういった手を打ったとか、この局面で勝ったか負けたかという情報を自己対戦サーバーが作っていって、それに基づいてパラメーターサーバーが学習していく。


計算資源の大小が勝敗を決めるのか?

 競合もそれなりの計算資源を用意してくることから、最終的には、使える計算資源の量に左右されるのではないかとも思われる。計算資源としては、今回のものは十分大きいが、世界大会で優勝するには足りない可能性も考えられる。
計算資源も大切だが、何も考えずに学習させると、計算量としては膨大になってしまうため、どのように自己対戦させるかのアルゴリズムが重要になる。つまり、いかにどう効率的に学習に利用するかが鍵になる。

 そのアルゴリズムは、「予備実験で確認することになるが、今の所は、エージェントを複数用意した、マルチエージェント方式(応用性のある競争による学習方法)が有望ではないかと思って進めている。」とのこと。これは今までとは異なる新しい手法である。
詳細は聞くことはできないが、多くの知見を持っている山口氏だからこそ世界2位になりえて、かつ新しい手法に挑戦できると筆者は考えている。

マルチエージェント方式については、「okaoの囲碁研究所」のWebサイトに記載されている。

 予備実験での評価は9路盤であるが、学習にかかる時間とか必要なAIを構成するニューラルネットワークのサイズの違いはあるが、学習手法に違いはないようで、9路盤が強い手法は、19路盤でも強いとのこと。そういう意味では、多大な計算資源を使わずに手法の確認ができるようである。

アルゴリズムの重要性については、「今後もっと一般的な、われわれが日常で使う、車の自動運転とか、経営課題など、より複雑な用途に対しては、想像以上の膨大な計算利用が必要になってくる可能性がある。そのときマシンパワーでゴリ押すにも、どこかで限界があり、手法の効率化というのが求められてくる。」と山口氏は話しており、将来を見据えてのことである。
囲碁で効率的な学習ができれば、さまざまな学習にも応用ができるのではないかというのである。

囲碁AIのオープンソース化の理由

 前述したように大きな目標として、8月の「第3回世界電脳囲碁オープン戦」での優勝があり、もう一つの目標は、日本の若手棋士の育成がある。その目標のため、作成したソフトウェアを使ってもらえるように、オープンソースとなる予定である。
(オープンソースとは、囲碁ソフトウェアのプログラムの公開である)

 そのソフトウェアをどうやって多くの人に届けるのか? そして、囲碁AIが打つ手の考えを、人間がどう学び、どう取り込んでいくのか? そのために、実際に利用するユーザーの協力が必要不可欠とのこと。
開発者の考える想定とは当然異なってくる部分もあるので、使用感だったり、使い方の要望だったり、こんな機能が欲しいといった意見やフィードバックが欲しいとのこと。

 山口氏によると、オープンソースの目的にはいくつかあるという。
1つめは、プログラムを公開することによって、いろいろな人に開発に参加してもらうこと。
例えば、開発への協力や、コンピューター資源の提供が得られれば、ソフトウェアがより成長し、使ってもらえるようになるのではないか。
2つめは、囲碁の分野を伸ばしていくこと。
将棋やチェスでは、とにかく作ったものを全部公開する風土があり、優勝した人でも情報を全部公開している。その情報をベースに、より強くするにはどうするのかを考えていく。こうして全体としてのレベルアップに繋げている。
個人の利益は度外視し、全体の利益のために公開するというものである。
最後は、非常に優秀なものを無償で公開することから、社会的な技術として還元する目的がある。より強いものを作っていくには、全体として盛り上げていくことが不可欠で、そのためにもオープンソースが良いのではないかとの考えである。


競争から協調へ

 囲碁AIをみると、AI(人工知能)が強くなっていくことで、既に人間が勝てなくなっているのに、若手棋士の育成という目標があるのは、どうしてなのかとも思う。山口氏によれば、「どこかで競争から協調に切り替わるタイミングがくる。」と言う。

 よく引き合いに出されているのが電卓とのこと。電卓と言えば、本格的に普及していったのは70年代以降で、今では、誰でも使え、小学生でも使っている。普及する前のNHKのアーカイブ※4を見ると、当時は電気計算機と言われていたが、そろばん名人と戦う姿がある。しかし、現在、電卓と計算勝負をする人は誰もいない。

 囲碁の世界では、囲碁AIが出始めてから、多くの棋士が、囲碁AIを利用し、AIの打つ手を研究に取り入れたことで、手の一致率の向上、悪手の率の低下が急激に変化している。
つまり、囲碁AIは、競う対象としての意味合いではなく、お互いがレベルを引き上げていくという側面がみられるのである。
そういう意味で、AI(人工知能)も、電卓と同じではないかと考えられる。

※4 昭和21年(1946年) 時の話題 指と器械の一騎打ち

AI(人工知能)との関わり

 昨今、AIのバイアス問題(偏った学習データによる差別や不公平)が話題になることがあるが、人間を介した教育や議論にも、何らかのバイアスというのは存在する。AIが問題とされるのは、差別や不公平のないAIが期待されているからだ。

 なにか大きな課題を解決する場合、今までどおり人間に頼った方が良いのだろうか? もし、差別や不公平のないAIというものが開発されれば、おそらく、人はよりAIを活用するようになるであろう。
AIを活用することで、今以上のスピードや確度で、さまざまな課題の解決につながっていくのではないだろうか。

グロービスが囲碁AIで世界一に挑戦するというのは、囲碁棋士の育成だけでなく、人材育成や組織開発、経営教育の研修をリードしていく企業としてAIに関わっていく※5ことで、グロービスの教育への活用や経営のAI開発に繋げていくことにより、今後の日本の将来にとっても、大きな役割を担うことになるのではないかと思われる。

※5 グロービスAI経営教育研究所(略称GAiMERi)
 経営教育を最高のエンタテインメントにする

今回の記者会見や取材を通じて、囲碁AIの現状や、人材育成の考え方を知ることができた。
8月の大会では、世界一が取れることをお祈りするとともに、取材に関して、グロービス様には厚く御礼申し上げたい。有難うございました。

「GLOBIS-AQZ」プロジェクト
 ニュースリリース:
 https://www.globis.co.jp/news/release/20190418_globis.html
 記者会見の動画(YouTube):
 https://www.youtube.com/watch?v=gYps2pBN8WE

 株式会社グロービス 公式HP:
 https://www.globis.co.jp/
 本件に関するお問い合わせ先 pr@globis.co.jp
 広報室 担当:田中