« ブロックチェーン技術のエネルギー分野での利用 | トップページ

アルファ碁ゼロの衝撃、囲碁は益々面白くなる

今週(2017年10月19日)、Google DeepMind社が発表した「アルファ碁ゼロ」(AlphaGo Zero)は、アルファ碁Masterを超える新たな可能性を示して、囲碁関係者を驚かせました。アルファ碁ゼロはまた、AI(人工知能)に人間が構築してきたデータベースから学習させるより、AI自身にゼロから独学させた方が勝るという、衝撃的な可能性を示しており、囲碁界のみならず広く一般からも関心を持たれています。

参考:
Deepmind社発表
Nature誌論文
Nature論文付録ニュース・コメント

Google Deepmind社が、Nature誌に発表したアルファ碁ゼロの論文にはいろいろな面白い結果が出ています。アルファ碁ゼロがいろいろな条件で打った棋譜80局もダウンロード可能です。

参考:
Nature誌論文付属データ
Deepmind社データ(アルファ碁全般)

これらを眺めて興味を持った点を以下ピックアップ/コメントします。

1. AIの上達スピード

自己学習時間と碁の強さは下の図のように、独学開始から3日で碁のトッププロ並の強さになり、21日で人間の棋譜から勉強して世界のトッププロに60連勝したアルファ碁マスターより強くなり、勉強させた40日間強くなり続けています。
Trainingtimegraph171019r01

2. AIの強さ

上の図の縦軸はEloレーティングという碁の強さを示す指標で、人間のトップは中国・柯潔3668点・日本・井山七冠3552点など3500~3600点程度(2017年10月20日現在)であるのに対し、アルファ碁ゼロは5185点と高いレベルに達しています。Eloレーティングの定義から、人間のトップとアルファ碁ゼロを対局させた場合の人間の勝率は約6200回に1回と計算され、実力的にAIは人間を遥かに超えるレベルに達しました。

* EB=1/{1+10**(RA-RB)/400}=1/{1+10**(5185-3668)/400}=1/6203
EB: 人間が勝利する確率、RA: アルファ碁ゼロのEloレーティング、RB: 人間トップのEloレーティング

Elorating20171020
Elo20ratingss

3. AIの消費エネルギー

アルファ碁の進化で興味があるのは、AIに使用するコンピューター(集積回路)のエネルギー消費の変化です。次の図のように、初期のアルファ碁からアルファ碁ゼロに進化するに従ってTDP(熱設計電力)が大幅に下がって効率が格段に向上しています。力任せの方法から賢い方法に変わってきたためと思いますが、これもAIが考えたことでしょうか?

Alphago20efficiencys_2

4. AI囲碁の楽しみ

AIの技術・社会などにおける将来性も楽しみですが、囲碁ファンにとってはAIによって全く新しい囲碁の打ち方や楽しみ方が創出され囲碁が益々面白くなってきたのが嬉しいです。

|

« ブロックチェーン技術のエネルギー分野での利用 | トップページ

囲碁」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« ブロックチェーン技術のエネルギー分野での利用 | トップページ