Ａ級リーグ指し手１号

2025年6月
日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

携帯URL

資料館

最近のトラックバック

プロ棋士は「AIに奪われる職業 No.1」か？ (Tsurezure Pentatonic)
プロ棋士は「AIに奪われる職業 No.1」か？ (Tsurezure Pentatonic)
Seleniumを使ったFXや株の自動取引 (NegativeMindException)
内館牧子は将棋ファンの代弁者 (落語・将棋・サイクリング時々Lisp)
Bonanzaとbonkrasと「やねうらお」氏～第1回将棋電王トーナメントで活躍した「やねうら王」の前史 (熊本の弁護士　菅一雄のブログ)
歴史の証言「電王戦　ザ・ダークサイド」～伊藤初代電王（？）のブログ連載に大注目！ (熊本の弁護士　菅一雄のブログ)
内館牧子氏　『月夜の駒音』　〜「精神文化を学べ」〜　について (英の放電日記)
第２回電王戦観戦記 (オンラインブログ検定)
今後のコンピュータ将棋対局に一抹の不安 (ネット将棋生活)
[情報]将棋ソフトと機械学習 (大人になってからの再学習)

AlphaGoが誇大広告ぎみな件

Googleが開発した囲碁ソフトのAlphaGoが、世界で初めてプロ棋士に勝ったコンピュータとして大きなニュースになっています。Nature誌に論文が掲載されたのですが、仔細に読むといくつか不可解な点がありましたので、調査・考察してみました。

AlphaGoの論文はこちらから見えます。プロ棋士に勝ったこともありますが、何よりコンピュータ囲碁開発者（及び隣の分野のコンピュータ将棋開発者）を驚かせたのは、「既存の他の囲碁プログラムと対戦させた結果、495戦494勝だった」との報告でした。この報告は衝撃的で、これを読んだ他のコンピュータ囲碁開発者たちからは「俺の今までの努力が否定された」「目標を見失ってしまった」などの悲嘆の発言が相次ぐ始末でした。

論文から、AlphaGo、対戦相手のプロ棋士、及び他のソフトのレーティングを示したグラフを引用します。

CrazyStoneとZenはこれまでは最強クラスとされていた囲碁ソフトで、この２つどうしは大体同じ棋力と言えるでしょう。それぞれ「最強の囲碁」「天頂の囲碁」として市販されています。Googleはこれらの市販ソフトと自分達のAlphaGoを対戦させてレーティングを出したとのこと。薄いピンクの部分は、4子置いたときの勝率の上がり方を考慮したものです。これによると、AlphaGo 1台とCrazyStone(以下"CS"と略記)/Zenの差はレーティングにして1000近く。勝率で言うと99%以上の圧倒的な差です。４子置いてもなお500近い差、となっています。

Fan Huiというのが相手のプロ棋士の名前です。（以下、棋士の名前は敬省略。）2段とのこと。囲碁プロ棋士のレーティングを示すサイトがありまして、ここによると(1月30日現在で)世界ランキング631位、レーティング2917です。上記のグラフは、Fanのレーティングを基準として、推定されるFanとの差から他ソフトを相対的に位置づけたものです。

私自身もコンピュータ将棋をやる傍ら、一時期はコンピュータ囲碁を開発していたこともありまして、このニュースには強く興味を持ち、論文を読んでみました。すると、いくつか疑問点が出てきて、「このニュース/論文、どこまで本当なのだろうか？」と疑いを持つようになり、いろいろ考察してみました。

結論から書きます。

結論１）Google論文は「従来ソフトよりレーティングで約1000上回った」と主張するが、実際には技術的改良による向上分は200程度と思われる。この改善幅は、コンピュータ将棋では毎年実現されていたのと大差ない程度の幅にすぎない。

結論２）「プロ棋士に勝つ」ことは、実は技術的には従来から可能だった。Googleはそれを実際に（対局相手に対局料を払って）実現した、にすぎない。

以下、この結論に至った過程を順に説明していきます。

【疑問その１：CS/Zenのレーティング】

最初に「おかしいな」と思ったのは、CS/Zenのレーティングです。論文のグラフだと2000弱程度、４子で2500程度に見えますが、両ソフトの実力は本当はもっと高いことを示すはっきりした根拠があるからです。

これまでにプロ棋士対囲碁ソフトの対局はけっこう行なわれています。コンピュータ囲碁のウィキペディアにもいくつか書かれていますが、いちばんまとまっているのは（英語ですが）ここのページだと思います。

けっこうたくさんありますが、2012年以降、19路、人間はプロ、ソフトはCS, Zen, DolBaram(CS,Zenと並ぶ最強ソフトの一角)のいずれか、という対局だけ見てみましょう。この中では連笑は超一流（タイトルホルダークラス、レーティング3479）で、彼には５子で負け、６子で勝ちとなってます。このクラスには４子はきついようですが、武宮正樹、依田紀基、趙治勲、周俊勲あたりの3100-3200クラスにはけっこうな回数の対戦があり、４子でまあ勝ち越している感じ。正確な計算まではしてませんが、ざっくり見るかぎりCS/Zenの棋力は、４子置いたときに3200程度、と考えられます。

もちろん多少の誤差はあると思いますが、いくらなんでも2500というのは考えられません。つまり、Google論文では、CS/Zenの棋力を700程度不当に低く評価している、と言わざるを得ません。495戦494勝という対局結果についても、CS/Zenが実力通りならレーティング差からしてありえない話なので、何らかの理由で実力が出せない状況で対局がなされたのだろう、と推測されます。なぜこうなったのか、についてはまた後ほど論じます。

なお互先の場合は、Googleのグラフでは４子より500ほど下に見えます。つまり、４子のレーティング効果が500、と。これはトーナメントの結果ということなので正しいとしましょう。ただし４子といっても、プログラムの都合でコミ7.5目ありだそうなので、本来の（コミなしの）４子の差は500よりはやや大きいはずで、まあ600くらいとしましょう。すると互先のCS/Zenは2600程度と推定されます。

【疑問その２：AlphaGo論文の技術的改良点】

論文では、従来のソフトと比べて技術的にどのような点を改良したのかが書かれています。それを読むかぎり、まあ漸進的な改良で多少強くなることはわかるものの、レーティングで1000上がるほどのブレークスルーとは正直ちょっと考えづらい、というものでした。

論文によると、基本はCSやZenと同じく、MCTS(モンテカルロ木探索）をベースとしています。MCTSでは、現在局面（ルート局面）から浅い数手を展開して、その末端からは終局までランダムに手を選択して進めるランダムシミュレーション（プレイアウトと言います）を行ないます。そのプレイアウト結果の勝率によって、末端局面を評価します。

AlphaGoの改良点は、ざっくり言うと

改良点１）木探索およびプレイアウトでそれぞれ手の評価を行なうのだが、この評価値をディープラーニングによって決めた。実行時間の関係上、多数回実行するプレイアウト中の評価は「軽い」（実行時間の短い）ものである必要がある。そのため、木探索用の、精度は高いが重い手評価関数とは別に、プレイアウト用に精度が低いかわりに軽い手評価関数を用意した。

改良点２）局面の評価関数を強化学習によって作成した。末端局面の評価を、従来のようにプレイアウトのみで決めるのではなく、局面評価関数も考慮するようにした。

の２点です。

これらによって、若干強くなるというのはまあわかります。ですが、基本がMCTSである以上、MCTS固有の弱点があり、そこは全く手がつけられていない。MCTSは、その性質上原理的に、「深く、正確に」読むことが苦手です。それは即ち、死活やコウ争いが苦手ということになります。そこが克服できないかぎり、漸進的な向上はできても、大幅な棋力向上は難しいだろう、と私は考えています。ですから、今回のAlphaGoの改良が、これまでの最強ソフトであるCS/Zenよりレーティングで1000も上がるブレークスルーだというのはちょっと納得しかねるものがありました。

【AlphaGo再考】

以上の２つの疑問点から、Google論文は「CS/Zenの棋力は不当に(700だけ)低く評価している。その他の点は正しい」と仮定しましょう。この前提の元に描き直したのが次のグラフです。

AlphaGo(1台)とCS/Zenのレーティング差は200程度です。AlphaGo(distributed)というのは、CPU 1202個という第２回電王戦のGPS将棋を上回るクラスタバージョンです。これは１台バージョンよりレーティング250ほど上なのですが、技術的にはCS/Zenもクラスタ化するのはそう難しくないでしょう。将棋で使うαβ探索はカットノードという並列化しても無駄なノードがあり、無駄な並列化を避けてCPUリソースを効率的に使うことが非常に難しかったのですが、モンテカルロ囲碁ではそのような問題がないので並列化は比較的容易です。

対プロ棋士でのCSやZenのマシン構成は、記録が見つからないものもあってすべてわかっているわけではありませんが、第１回電聖戦では「CS: 64コアサーバ、Zen:6コアPC x 5台のクラスタ」という記述がありました。Zenはクラスタとはいえ、コア数ではAlphaGoの１台(48CPU + 8GPU)より少ないです。1202 CPUのマシンが使えるなら、AlphaGoと同様に250上げることはそう難しくないでしょう。ですからクラスタによる向上はAlphaGo固有でない、と考えてよいでしょう。CS/Zenは、単にそうした大規模クラスタが使える環境がなかった、というだけです。

そう考えると、AlphaGoによる進歩はレーティング200程度、と推定されます。レーティング200向上というのは、もちろんそれなりに評価すべき進歩ではあるのですが、正直それほどすごいという気はしません。コンピュータ囲碁はここどうなのかよく知らないのですが、コンピュータ将棋の例で言うと、名人を超えた2012年の直前の５，６年は、毎年レーティングが約150ずつ上がっていきました。なので、AlphaGoが「200向上」と聞いても、「将棋では毎年それに近いくらい上がってたよね」としか思わない、というのが私の率直な感想です。コンピュータ囲碁の人たちはここどう思うのか聞いてみたいですけれども。

あともう１点、「プロ棋士に初めて勝った」についてですが、これも自慢のポイントが正直よくわかりません。上記のレーティングサイトで見ると、Fan Huiよりもまだまだ下にプロ棋士がいます。記載されてるいちばん下で2600程度。これで終わりでなく、もっと下もいるわけです。ですから、2600程度のCSやZenでも、プロ棋士であれば誰でもいい、と相手を選ばなければ、低段位の棋士と戦って勝つことは今までも十分可能でした。

それが今までなされなかったのは、これは私の憶測になりますが、ひとつには低段位の棋士に勝ってもそう自慢にもならないだろうと思ってやる気がしなかったこと。もうひとつは、お金の問題です。低段といっても相手はプロなので、対戦してもらうにはそれなりの謝礼が必要になります。まして普通の対戦でなく、「ソフトと戦って、負けたら『世界で初めてソフトに負けた棋士』として永遠に語りつがれる」というリスクを考えると、通常の対局謝礼よりはずっと高い報酬でないと受けてもらえないと予想されます。囲碁ソフト開発者は個人レベルでやっている人が多いので、そんな大金は出せないと思ったことでしょう。

ところがGoogleは、ほとんど誰も知らないような低段のプロと対局の話をつけた。Fan氏の報酬については知りませんが、おそらくけっこうな金を積んだのでしょう。それで実際に対局して、「勝った！世界初！」となっているわけです。いや、悪いというつもりはないです。ただ、新聞やＴＶも大々的に報道してたけど、これってそんな大ニュースなんだろうか、というのが私の感触です。まあ、Googleの宣伝がうまかった、ということなのかもしれませんが。

【なぜCS/Zenが過小評価されたか】

さて、この点に戻って考えてみましょう。いちばん単純な答えとして考えられるのは「Googleが宣伝のため意図的に嘘をついた」なんですが、それはさすがにないと思います。Natureに載せるのですから、万一後で嘘がバレたりすると、博士号を剥奪されたりとか手記を発表したりとかいろいろありますので。ですから、論文では「嘘は書いてない。事実だけを書いてある」ものと仮定します。

ただここがくせもので、「嘘ではない、事実しか書いてない」としても、結果として読んだ側が得る印象が真実の姿とはまったく異なるようにする、という書き方は可能です。意図的か偶発的かは別としても。ですので、論文の細部を注意深く読んで理解し、真の姿を見極めないと、誤った印象に踊らされる可能性があります。

まず「495戦494勝」は、事実であり、実際に対局が行なわれてそういう結果だったのでしょう。それは大前提とします。ただこれは、上で書いた「レーティングは200差」ならばまずありえない話なので、「じゃあなぜそうなったのか」の説明が必要になります。

現時点での私の考えとしては、少なくとも以下の４点が原因となりえたと考えています。もちろんこれはあくまで現時点(2016-01-30)での話で、今後新しい情報が入ってくれば変わる可能性はあります。

原因１）CS/Zenが市販バージョンだった

たとえばコンピュータ囲碁（将棋でもそうですが）の大会に出る時に開発者が使用するプログラムと、それを元に市販ソフトを作るときのプログラムとでは、バージョンや設定がかなり変わることがあります。開発版の方は通常、その時点で最強の力を出せるように、その時のマシンに合わせて細かくチューニングされていますが、市販版の方はギリギリの強さよりも、製品としての使いやすさ、安定性、様々なマシンで動作する可搬性などの方が重視されます。その結果開発版よりはかなり弱くなります。どの程度弱くなるかは、一概には言えませんが、囲碁プロ棋士の意見として「置石ひとつくらい」とか「３子くらい」といった声が見られます。

置石ひとつがレーティングでどれだけに相当するのかも、定説はないのですが、たとえばこの記事ではp.20で「150点差で1子」となっています。いやもっとある、という声もあるのですが、150は低めの見積もりのようなので、ここでは「1子は少なくとも150点以上」と仮定します。そうすると、市販版は開発版より少なくとも150は弱い、ということになります。Google論文では「CS/Zenは市販版を使った」と明記していますので、これは間違いなく原因のひとつとなっています。

なお置石Ｎ子というのは、Ｎ－１個置いてから黒が（残った星に）打ち出して対局を開始すると考えると、Ｎ子と言ってもアドバンテージとしてはＮ－１個ぶんに相当します。ただし置碁は通常コミがないので、コミを約半子相当とすると、Ｎ－０．５個ぶんくらい、と考えるのが妥当のようです。先に、グラフを見ると４子が600くらい、と書きましたが、この式だとN=4で150*(4-0.5)=525。そこそこ合ってるようです。

原因２）マシンが違う

これは論文にはっきり書いてあるのですが、ソフトどうしの対戦をしたときに各ソフトが使用したマシンが異なります。AlphaGo(1台)は 48 CPU + 8 GPU。これに対して CS は32 CPU、Zenは 8 CPU。こうなったのはおそらく、市販ソフトとして設定できる最大構成がそうだったのだろうと思います。

しかしそれにしても、これだけ構成が違う状況で対戦させて、その結果を引用して「これだけ強くなりました！」と主張するのは、いくら背景が（細かい字で、紙版にはなくWebだけにつく、いちばん後ろの方の付録で）明記してあるとはいえ、ちょっとGoogleの見識に疑問符がつくところです。

原因３）チューニングが十分でなかった

上の原因１と少し関連するのですが、開発版では通常、その時の大会なりで使用するマシンやプログラムの構成を細かくチューニングします。チューニングの際考慮する点としては、CPU数、キャッシュ容量、メモリ量、GPU使用の有無、（クラスタなら）ネットワークの速度、Hyper Threadingの有無、使用するコンパイラとそのオプション、時間配分、その他各種の資源配分、等々とにかくいろいろあります。囲碁ソフトがプロ棋士と対戦する時は、いつにも増してチューニングに心を配るでしょう。

しかし市販ソフトでは、売る側はどんな状況で使用されるのか事前にわかりませんので、必然的に「最大公約数」的な構成を想定してオプション等を決めることになります。その結果、一般的でない構成だとチューニングが合わず、リソースに見合う実力が出ないことがあります。

上記はあくまで推測にすぎませんが、これが起こっていることを示す間接的証拠は論文中に見られます。上に示したレーティングのグラフで、CSとZenはほぼ同じ強さになっています。しかしこれ、実はCSが32 CPU、Zenが8 CPUなのです。CSとZenはもともとがほぼ同じ強さと考えられますので、32 CPU vs 8 CPUでは本来は32 CPUの方がかなり強くなるはず。しかしそうならないのは、32 CPUの方でチューニング不足の弊害が出て、リソースに見合う実力が出ていないことを示唆しています。

CSの市販版である「最強の囲碁」を販売しているのはアンバランスという会社ですが、あまり大きな会社ではなさそうです。32CPUマシンというものは相当高いものだし、ホームページをざっと見たところ、サーバ向けの仕事をしているわけでもなさそうなので、マシンを持っているかも微妙そうなのですが、32CPUモードできちんと動作確認されているのでしょうかね。

原因４）短時間設定がAlphaGoに有利

この点を説明するにはAlphaGoの改良点に関する中身の（最低限の）理解が必要ですので、まずそこを少し説明します。

上の「改良点１」で書いたように、「重い手評価関数」（論文中では"pσ"で表されている）をディープラーニングによって作成しています。このpσは何に使うかというと、木探索中の各ノード（局面）において、そこからの可能な合法手のそれぞれに対し、確率分布を与えます。MCTSで、その確率分布に従って各合法手の試行回数を制御します。

MCTSが進むにつれて、プレイアウトの結果に応じて、各ノードの確率分布を変更していきます。ざっくり言うと、合法手間の確率分布の空間において、勾配降下法（山登り法）を行う、と考えれば大体イメージとしては合ってます。で、pσはその勾配降下法における初期値に相当します。（正確に言うと最適化するのは'action value'なのですが、まあ細かい話は省略。詳細は論文を参照ください）

で、このpσ、たぶんおそらくそれなりに優秀なものなのでしょう。つまり、初期値として選ぶ点が、実際の収束先をそれなりに適切に予測できている、という意味で。ただこれは、時間が十分ある状況では重要性は薄れます。山登り法において、初期値をどこに取ろうが、十分時間をかければ結局同じところに収束するのですから。初期値を適切に取ることは、収束先自体の精度を上げるものではなく、収束までの時間を短縮するにすぎません。（まあとはいっても、時間短縮は実践的には重要な点ではあるので、その点はたしかに評価できるのですが。）

…とここまで説明したところで話が戻ります。論文によると、「ソフトどうしの対局はすべて１手５秒で行なった」とあります。これ、囲碁の対局としてはかなり短いです。このような短い時間設定だと、どんな影響があるでしょう？

CSやZenの中身の詳細をよく知らないのですが、おそらくpσのような確率分布の初期値推定には凝ったことはしてないのだと思います。この状況で、MCTSを短時間で打ち切るとどうなるか？山登りが十分に進まず、初期値に近いところで打ち切られます。そうすると、初期値が適切に予測できている方が有利になります。これが、AlphaGoが圧勝した原因のひとつになったと考えられます。

この１手５秒という設定を選んだのが、上記のことを考慮してAlphaGoが有利にするために選んだ、とまで主張するつもりは私はありません。別に意図的ではなく、たとえば対局を早く済ませるため、などの理由で選んだだけかもしれません。そこはたぶん永遠にわからないのでしょう。ただ、もしも、ですが、もし上記のことまで考えたうえでこれを意図的に選んだのだとすれば…いやそれは（別の意味で）かなり手強い相手だな、という気はします。

以上４点が、CS/Zenのレーティングが過小評価された理由として現状私が推測している原因です。このうち１）と２）は間違いないですが、３）と４）は私が推測したもので、100%合っている自信まではありません。ただ仮に間違っていたとしても、「じゃあ本当の原因はなんだろう」という話になるだけで、「やっぱり論文のレーティングが正しいんじゃないか」という話にはなりません。CS/Zenのレーティングの数値自体は、前述の通り、他の証拠からわかっているからです。

【まとめ】

以上見てきたとおり、繰り返しになりますが、

・AlphaGoのレーティング上昇分のうち、技術的なものは200程度。あとはお金の効果（マシン差やクラスタ化）と、CS/Zenを過小評価したことによるもの。

・「世界で初めてプロ棋士に勝った」はAlphaGoによる技術の向上の結果ではない

が本記事の主旨です。

最後に、誤解されないよう書いておきますが、Googleが悪いと言ってるわけでは全くないです。コンピュータ囲碁や将棋の分野は、人によっては「単なる遊びだろ」と言われてなかなか市民権を得られないことが多いです。なので、Googleのような会社が仕事の一環として参戦してくることは、私を含めて分野の関係者なら大歓迎ですし、また資金力にモノを言わせること自体は、非難されるいわれは全くありません。ただ、報道や反響からして、技術の結果と資金力の結果が混同されている印象を受けたのと、CS/Zenの棋力が不当に低く誤解を招く書き方なので、そこはいろいろ弊害がありそうなので正しておいた方がいいかな、と思ってこの記事を書きました。Googleの論文、先にも書いたとおり、「決して嘘は書いてない」ですし、こうして私のようなウォッチャーが分析できるだけの情報をきちんと開示しているわけです。見る人が見ればわかるし、きちんと議論できるようにしている。その点は全く正しいと思います。

…ということを述べた後で、ひとつだけ希望を述べさせてもらうと、もう少し客観的に判断できる材料を出してもらえないかなあ、ということです。具体的には、UEC杯に参加するなり、KGSに参加するなりして、「実際に強い」ことを示してほしい。今までGoogleから出てきた情報で、「実際に強い」ことを示すものは、Fan Huiとの10戦の結果しかないのです。CS/Zenとの対局結果は上述の理由で参考にならない。Google側としても、この記事のようにいろいろ疑う人が出てくるよりは、誰もが文句の言いようのない客観的証拠を見せた方が批判が出なくて済むと思うのですけどね。

まあイセドル戦がそうだ、というつもりなのかな。そう言われるとしょうがないですが、イセドル戦に負けたらでいいから、UEC杯なりKGSに参加してほしいな、と思っています。

ちなみにイセドル戦の予想ですが、私はイセドルが勝ち越すと予想しています。現状おそらくレーティングでイセドルとAlphaGoは300差程度。誤差があるので最悪150くらいかもしれませんが、5番勝負とのことなので、１、２戦落とすことはありえると思っていますが負け越しはないだろうと思います。まあAlphaGoがこれから３月までの間に大幅に改良されなければ、の話なので、なんとも言えないといえばそうなのですが。

p.s. 本記事を書くにあたって、主にツイッター上で多くの皆様から情報・意見等いただきました。皆様、どうもありがとうございました。

2016年1月31日 (日)囲碁プロセサ|固定リンク

« 最後のピースも嵌まる |トップページ|FXや株の自動取引ツールの作り方 »

「囲碁プロセサ」カテゴリの記事

つい先ほど、KGSのComputer Go Roomでヨーロッパ初段の棋士(KGS 8d)と開発版のZen19X(KGS 7d、i7 5960X使用)が1手15秒の定先で対局し、Zenが勝ちました。今のZenはAlphaGoに近い棋力を持っているようです。

投稿:ねこ大名 |2016年2月 1日 (月) 01時30分

自分も昔、大学の授業でオセロのAIとかやってたので大変参考になります。

3月の韓国人棋士との対戦が試金石になるのではないでしょうか。もしこの人に勝てれば問答無用で最強AIの誕生になりますね。

投稿:John |2016年2月 1日 (月) 02時29分

＞CS/Zenのレーティングは4子置いたときに3200程度

これについて私は、断言は出来ませんが「もう少し低い」と思います。
伊藤さんはご存知ないのだと思いますが、私はコンピュータ囲碁の研究会や人工知能学会などで、他のレッスンプロとZenの置き碁を見てきました。
例えばhttp://blog.goo.ne.jp/starnine/e/318ad3aee58f98e9242d9848b6203c3eにもありますが、Zenは竹清プロに4子で負けています。竹清プロはなぜかhttp://www.goratings.org/のレーティング(*)には載っていませんが、こちらhttp://sports.geocities.jp/mamumamu0413/internal/rate1.htmlによると光永プロと互角くらいで、光永プロは(*)だとレート2849、724位です。もちろん一回打っただけなので、それで竹清プロよりレートが低いというつもりはありませんが、3200はないかなあと思います。

＞若干強くなるというのはまあわかります。ですが、基本がMCTSである以上、MCTS固有の弱点があり、そこは全く手がつけられていない。MCTSは、その性質上原理的に、「深く、正確に」読むことが苦手です。それは即ち、死活やコウ争いが苦手ということになります。

はい、これはその通りです。

＞Zenはクラスタとはいえ、コア数ではAlphaGoの１台(48CPU + 8GPU)より少ないです。1202 CPUのマシンが使えるなら、AlphaGoと同様に250上げることはそう難しくないでしょう。ですからクラスタによる向上はAlphaGo固有でない、と考えてよいでしょう。CS/Zenは、単にそうした大規模クラスタが使える環境がなかった、というだけです。

うろ覚えで申し訳ないのですが、Zenの加藤さんは「これ以上マシンを増やしても強くならない」ということを言っていたと思います。少なくとも7dになる前の旧バージョンのZenは、すでにマシンパワーによる強さの伸びが飽和していたと思います。

＞コンピュータ囲碁はここどうなのかよく知らないのですが、コンピュータ将棋の例で言うと、名人を超えた2012年の直前の５，６年は、毎年レーティングが約150ずつ上がっていきました。なので、AlphaGoが「200向上」と聞いても、「将棋では毎年それに近いくらい上がってたよね」としか思わない、というのが私の率直な感想です。コンピュータ囲碁の人たちはここどう思うのか聞いてみたいですけれども。

ZenがKGS6dになったのが2012年、7dになったのが2016年です。KGSの6d-7dの差は約200Eloと言われているので、200向上させるのに約4年かかっています。2012年までは順調だったのですが、そこから停滞していました。それを打ち破ったという意味で、やはり今回の論文は意義があると思います。

＞あともう１点、「プロ棋士に初めて勝った」についてですが、これも自慢のポイントが正直よくわかりません。上記のレーティングサイトで見ると、Fan Huiよりもまだまだ下にプロ棋士がいます。記載されてるいちばん下で2600程度。これで終わりでなく、もっと下もいるわけです。ですから、2600程度のCSやZenでも、プロ棋士であれば誰でもいい、と相手を選ばなければ、低段位の棋士と戦って勝つことは今までも十分可能でした。

うーん。これは一人の碁打ち(アマ六段)としての主観なので全然説得力がないことは承知ですが、CSやZenでは一番弱いプロ相手でも互先では勝てない気がします。もうちょっと客観的なデータとしては、昨年のUEC杯でCSは東洋囲碁(ネット碁会所です)7段の人に互先で完敗していますが、プロだとどんなに弱っても東洋囲碁8段くらいだと思います。もちろん一発入る可能性はあるのかもしれませんが、今回の論文みたいに0-5(2-8)ってことにはならないと思います。

＞実はCSが32 CPU、Zenが8 CPUなのです。CSとZenはもともとがほぼ同じ強さと考えられますので、32 CPU vs 8 CPUでは本来は32 CPUの方がかなり強くなるはず。しかしそうならないのは、32 CPUの方でチューニング不足の弊害が出て、リソースに見合う実力が出ていないことを示唆しています。

これは確かにありうるかなと思います。後述のこととも関連するのですが、CSの製品版の「最強の囲碁」を以前試した時、4coreのノートでも凄く長考してきました。それに対し、Zenの製品版の「天頂の囲碁」は瞬時に打ち返してきました。そして、両者の強さは同じくらいと感じました。CSとZenはもともとがほぼ同じ強さというのは多分その通りだと思いますので、多分「天頂の囲碁」はチューニングがうまくいっていて「最強の囲碁」はチューニング不足なのかと思いました。

＞とここまで説明したところで話が戻ります。論文によると、「ソフトどうしの対局はすべて１手５秒で行なった」とあります。これ、囲碁の対局としてはかなり短いです。このような短い時間設定だと、どんな影響があるでしょう？
CSやZenの中身の詳細をよく知らないのですが、おそらくpσのような確率分布の初期値推定には凝ったことはしてないのだと思います。単純に一様分布か、あるいは自明な手（取る手、アタリを逃げる手、等）を優先させるとか、その程度で。この状況で、MCTSを短時間で打ち切るとどうなるか？山登りが十分に進まず、初期値に近いところで打ち切られます。そうすると、初期値が適切に予測できている方が有利になります。これが、AlphaGoが圧勝した原因のひとつになったと考えられます。

これははっきり「違う」と断言出来ます。まず、先ほど述べたように、少なくとも「天頂の囲碁」は瞬時に打ち返してきても十分強いです。これはなぜかというと、pσに相当するものをZen(やCS)も相当作り込んでいるからです。Fuegoの作者のMartinMullerさんは「ここの作り込みが強さの大部分を占める」と私にアドバイスしてくれたこともありました。もちろんDCNNには及ばないのですが、Zenのこの部分も高段者の棋譜との一致率は40%を超えているはずです。
http://524.teacup.com/yss/bbs?page=34&にも書かれていますが、Zenくらいになると2014年時点で1000playoutでKGS2.5d、これは1コアで1秒くらいのはずです。
Zenもpσに相当するものが優れているため、こんな少ないプレイアウトでもかなりの強さを発揮します。ちなみに2000poで3.2d、4000poで3.5d、8000poで3.8dと、プレイアウトを増やしても伸びは大したことありません。
ちなみにZenがつい最近7dになったのはAyaやHiraBotが取り入れ始めたDCNNをこの部分に入れたかららしいです。確かにDCNNによるpσは凄いのですが、もともとのZenのだってかなりのものです。

以上を踏まえた上で、私のトータル見解を述べさせていただきます。
1.確かに、ZenやCSの4子置きが2600くらいというのは低すぎる可能性が高いが、3200にはならないと思う。確かに日本のトッププロが4子置かせて負けているが、レッスンプロが4子置かせて勝ったこともあるので、3200は高すぎる気がする。
2.なぜGoogleのAIがZenやCSに4子置かせて大幅に勝ち越したかというと、おそらくプロなら絶対に打たないような無理手を打っている。なぜなら、Value Networkは「作られた時のコミでしか盤面を評価できない」から。すなわち、置き碁で打つ手を自然にするためにコミを動的に調整するようなことが原理的に出来ない。その状態でモンテカルロに組み込んで置かせ碁を打ったら、恐らく序盤から相当無理手を連発する。
3.実際、私の知り合いのアマチュアは天頂の囲碁に5子置かせて勝つが、話を聞くと天頂の囲碁は無理手を咎められないことが結構あるらしい(死活がわかっていないので)。
4.GoogleのAIもZenもCSもモンテカルロの弱点を克服したわけではないだろうが、GoogleのAIの方が相対的にZenやCSよりこれらの弱点が霞んでいる。
5.どれだけ少なく見ても、囲碁において不可能と言われていた評価関数(Value Network)を作ったという功績は評価できると思われる。

というのが、伊藤さんのブログを読み、自分の経験を振り返って、論文を読んでの私の今の考えです。

長くなってしまいすみませんでした。

投稿:荒木 |2016年2月 1日 (月) 02時51分

基礎分野のようにアルゴリズムの優劣を比較したというより、ソフトウェアの性能比較を行ったという趣向の論文であり、実験環境の違い自体はあまり気になりませんでした。
しかし、1手5秒という制限の部分やその対局環境については私も気になっていました。
どのZenを用いたか等詳細に知りたい所ですね。

個人的には「そうだそうだ！」と思える箇所も多く好きなのですが、タイトル含め、少しCS/Zenや既存手法サイド寄りの邪推し過ぎな記事の気もします。
AlphaGoのアルゴリズムを理解した上で再度投稿して頂けると助かります。

投稿:サバ |2016年2月 1日 (月) 04時18分

記事内にある囲碁棋士のレーティングサイトですが、Fan Huiのレーティングはわずか11局から計算されていると思われます。
私の目にはFan Hui二段が後藤俊午九段と同じレーティングには見えません。Fan Huiの実際のレーティングはもっと低いと思います。

投稿: |2016年2月 1日 (月) 06時35分

強さの客観的証拠は棋譜で十分でしょ。

投稿:おとりすがり |2016年2月 1日 (月) 08時29分

荒木さん
コメントありがとうございます。長文歓迎ですよ。神は細部に宿ります。

・レーティングに誤差があるのは承知ですが、せいぜい+-200くらいじゃないですかね。3000は下回らないと思うのですが。まあここは水かけ論になるだけなので議論はしませんが。

・クラスタ性能が飽和するというのは（素人考えですが）ちょっと信じがたいのですが…　MCTSの性質上、たくさん読むほど強くなるのは自明な気がするんですが、違うのかな？どっかがボトルネックになってCPU増やしてもプレイアウト数が増えない、って話じゃないんですよね？（って荒木さんに言うことじゃないか、ggさんに聞かないとわからんか）

・4年で200ですか。やっぱ将棋とは違いますね。囲碁の方が難しいのか。

・pσ相当（手評価）はZenも凝ってるのですね。ここは私の認識違いでした。ただG論文では「わずかな一致率の向上が棋力に大きく貢献した」とも書いてますので、やはりここの性能差が効いてる可能性は十分あるのではないでしょうか。

・すみません、ここがちょっとわからなかったのですが、
>2.なぜGoogleのAIがZenやCSに4子置かせて大幅に勝ち越したかというと、おそらくプロなら絶対に打たないような無理手を打っている。
　無理手を打ってるのはAlphaGo? CS/Zen? #棋譜見てないです（というか私は見てもわからん）
コミ固定はAlphaGoの方なんだから(CS/Zenはコミ対応できるのですね？）AlphaGoが無理手を打つ、だと思うんですが、それがなぜ勝ち越しにつながるんでしょう？

#え、コミなんてアゲハマで調整すればいいんじゃ…と書きかけて気づきました、中国ルールなんですね--;

・これなんですが、
>5.どれだけ少なく見ても、囲碁において不可能と言われていた評価関数(Value Network)を作ったという功績は評価できると思われる。

ツイッターでも書きましたが、評価関数だけだとプレイアウトだけより弱いけど、λ=0.5で一気にプレイアウトだけよりも強くなる、ってのが全く摩訶不思議なんですよね。ここが一番の功績かも？
評価関数で評価すべき局面と、プレイアウトを使うべき局面がある、とかいうことなんでしょうか。
#あ、じゃあそれを見分けるのをディープラーニングで…（適当

投稿:伊藤 |2016年2月 1日 (月) 09時51分

伊藤さんにお聞きしたいのですが、Google の「資金力」による棋力アップはレートにしてどれくらいと思われますか？

本件に関していえば、公式でも「ディープラーニングや強化学習に莫大な計算量が必要であり、Google クラウドプラットフォームをフル活用した」と述べられております。
http://googlejapan.blogspot.jp/2016/01/alphago.html

ある意味資金力を使って数の暴力で強くした部分もあるかと思うのですが、その棋力アップは新手法的な（研究的な）意味でのブレイクスルーではないですよね。そこで、資金によるアドバンテージがどれぐらいかについて、伊藤さんがどのような見解かお聞きしたいです。（例えば個人で用意できる範囲のクラスタを利用した場合と、学習に Google のクラウドが利用される場合とのレート差がどれくらいか、等）

投稿: |2016年2月 1日 (月) 10時53分

＞まあここは水かけ論になるだけなので議論はしませんが。

はい。以前Twitterで申し上げた通り、そもそも置き碁でレートを決めること自体無理があると思いますし、結論は出ないと思います。

＞クラスタ性能が飽和するというのは（素人考えですが）ちょっと信じがたいのですが…　

まあ私も加藤さんの言葉を誤解しているだけの可能性もありますが…。ただ、まず、Zenより弱いbotですがAyaのデータとしてhttp://524.teacup.com/yss/bbs?page=34&があります。1台でプレイアウトを増やしていっても、あるところで伸びが鈍化する可能性はZenにもあると思います。そしてこれがおそらく本質だと思うのですが、Ayaのこのデータはおそらく「Tree並列」という最も効率の良いMCTS並列化手法でやっています。これをマシンを分けてやろうとすると、「探索木の情報を通信する」か「Root並列というちょっと劣る並列化手法を使う」かしないといけなくなり、前者だと通信速度がネックになってpoがのびない、
後者だと早くにサチってしまう可能性はあると思います。
MCTSのスパコンを使った並列化について美添さんという方も研究しているのですが、以前話を聞いたところ、「台数を増やせば棋力が伸びる」という単純なものではないとのことだった覚えがあります。

＞4年で200ですか。やっぱ将棋とは違いますね。囲碁の方が難しいのか。
そうですね。しかもZenがつい最近一気に200上がったので、3年と少しの間ほぼ0でした。これが「もう一つか二つブレイクスルーが必要」と言われていた原因です。

＞pσ相当（手評価）はZenも凝ってるのですね。ここは私の認識違いでした。ただG論文では「わずかな一致率の向上が棋力に大きく貢献した」とも書いてますので、やはりここの性能差が効いてる可能性は十分あるのではないでしょうか。

もちろんあると思います。NiceGoに始まり、私のMC_ark、HiraBot、Aya、darkforestそしてZenはDCNNによる手評価を用いて強くなりました。ただ、darkforestのDCNNが一番強力だとは思うのですが、それでもdarkforest(のMCTS組み合わせ版のdarkfmcts)はKGS5d〜6dにある壁を突破できておらず、Zen以外のソフトも2d〜5dです。なぜかZenとAlphaGoだけ壁を突破してしまい、おそらくMCTSの他の部分との相性などがあるのなと想像します。
いずれにしろ、当初の(32coreや8coreで)5秒が短すぎるという気は私はあまりしませんね。

＞すみません、ここがちょっとわからなかったのですが、
＞>2.なぜGoogleのAIがZenやCSに4子置かせて大幅に勝ち越したかというと、おそらくプロなら絶対に打たないような無理手を打っている。
＞　無理手を打ってるのはAlphaGo? CS/Zen? #棋譜見てないです（というか私は見てもわからん）
コミ固定はAlphaGoの方なんだから(CS/Zenはコミ対応できるのですね？）AlphaGoが無理手を打つ、だと思うんですが、それがなぜ勝ち越しにつながるんでしょう？

無理手を打っているのはAlphaGoですね。これは囲碁をやらない人には実感できないことだと思うのですが、人間の囲碁の世界でも往々にして「無理手を打つアマチュア」の方が「本手ばかりを打つプロ」より置かせ碁が得意という現象が起きます。
囲碁というのは相手の無理を咎めないと一気に悪くなるゲームです。まあ極端な例がハメ手ですね。おそらくCSやZenもハメ手みたいな手にハマっているのではないかなと予想したわけです。(棋譜が公開されていないので予想の域を出ませんが。)

＞ツイッターでも書きましたが、評価関数だけだとプレイアウトだけより弱いけど、λ=0.5で一気にプレイアウトだけよりも強くなる、ってのが全く摩訶不思議なんですよね。

はい、とても不思議です。ただ、私は以前から、「人間は囲碁を打つ時色んな終局図を想定(と言ってもすごくぼんやりとですが)して形勢判断するから、プレイアウト方策も色々混ぜてプレイアウトした方が強くなるのではないかなー」と思っていたことがあります。私は結局それに関しては良い結果を得られなかったのですが、Googleはそれに成功したのかなという気もします。とすると、評価関数もプレイアウトも何通りか混ぜれば、さらに棋力が向上するのかなーと妄想したり(笑)

投稿:荒木 |2016年2月 1日 (月) 11時31分

>Google の「資金力」による棋力アップはレートにしてどれくらいと思われますか？

クラスタ版の+250はまあ資金力と言っていいと思います（全くそれだけというわけではなく技術もありますが、まあ他と比べると）。ディープラーニングは、資金（計算）力もいるけど技術力もいるので、それを技術じゃないと言うのはさすがに酷かとw

>無理手を打っているのはAlphaGoですね

AlphaGoの無理手をCS/Zenがとがめられない、ってことですか。たしかに置碁の白は穏やかな手ばっか打ってちゃダメですよね。

大変参考になる情報をたくさん、ありがとうございました。またいろいろ教えてください^^;　＞荒木さん

投稿:伊藤 |2016年2月 1日 (月) 12時10分

こちらこそ、伊藤さんのブログは参考になりました。ありがとうございました。どうも私は人の言葉をすぐ信じるので、論文もなかなか「疑いの目」で見れないんですよね…。

投稿:荒木 |2016年2月 1日 (月) 12時29分

ニュースを見る限り、何かものすごいブレークスルーがあったように感じていましたが、そうでもない可能性もありそうですね。欧州チャンピオンということだったので、すごいことだと思っていましたが、ランキング的にはそうでもないと分かって、ちょっとがっかりな感じはあります。この会社としては、ある程度、マーケティング的な要請があったのでしょう。
とはいえ、この分野が盛り上がるきっかけにはなったと思いますし、個人的なSF嗜好を掻き立ててくれるニュースでしたので、今後の展開に期待したいところです。

投稿:ひろっち |2016年2月 1日 (月) 12時46分

描き直したグラフ　ﾜﾛｽ☆ｗｗｗｗ（＾▽＾）

UEC杯が　準決勝戦にならなくて　よかったぜ～☆（＾～＾）ｗｗｗ
ponanGo や Gonanza や Sandra の一発に期待して楽しむ予定だぜ☆ｗｗｗ（＾＿＾）

投稿:むずでょ（きふわらべ） |2016年2月 1日 (月) 13時58分

Google、ハサビス氏もいきなりセドル氏レベルに掛けあっているあたり、
それなりの目算あるのかなあと。

いずれにしても来月が楽しみです。

投稿: |2016年2月 2日 (火) 08時40分

少なくとも、アマチュア 6,7 段程度の私から見て、
Fan Hui との棋譜５つにおける AlphaGo は、これまでの MC のトップソフトのそれとは、全く比較にならない異質の強さ、手の感性の良さ (これまでの MC はご指摘のコウや死活の不安定さがあったが、今回はむしろコウや死活にめっぽう強かった) です。竹宮さん、依田さんなどとの Zen や Crazy Stone　の公開対局の棋譜も全部チェックしていますが、異次元に違います。別に私だけでなく、トッププロの検討で、あまねくそういう評価です。少なくとも囲碁棋士界隈では、韓国棋院の九段 Myungwan Kim が棋譜を検討した結果自分も負ける可能性があると言及するくらいの大ニュースです。

なお Fan Hui は確かに日本では無名ですが、将棋で言えばあからと対戦した当時の清水市代さんよりは相当格上の印象です。日本の女流に対する勝率は8,9割は行くんではないですかね。私の検索範囲では、中国・韓国の囲碁プロ棋士が伊藤さんのように Fan Hui を全く無名扱いしているのは見ませんでした。もっとも今回の5つの棋譜は Fan Hui がコンピュータを意識しすぎて、全く実力を出し切れていないように見えましたが。
少なくともプロ棋士にとっては、対戦棋士の有名・無名以上に棋譜のレベルが大事で、これまで、「よく頑張っているが、まだまだだね」と評される MC に対して、世界ランキングトップの Ke Jie が「標準的な駆け出しの若手プロ」と表現するレベルの実力になってきたことは確かです。

なので、印象操作（？）の度合いを個人的な感覚で申し上げますと、
今回の快挙はプロ棋士界隈では大ニュースです。
どちらかといえば、伊藤さんが科学的に AlphaGo の強さがそれほどでもない　と印象操作している感覚があります。そして、その印象操作は、伊藤さん御自身が指摘されている Google によるゲーム AI プログラミングのプロパガンダみたいな方向から鑑みて、正しいと思います。つまり、プログラミングの外側にいる人は、それこそ将棋である感覚と同様に「人間的な感性での棋譜の評価」でバイアスのかかった評価をしている可能性があるからです
もしくは、この記事やコメントにありますように、レーティング 200 程度（私にはもっとはるかに上昇しているように感じられるが）の上昇で、その程度に冷静に受け取るのが、正しい知的態度である可能性があります。Fan Hui との棋譜がこれまでのソフトのそれに比べて、人の目から見てあまりに美しいため、プロ棋士界隈では過度に加熱したということも言えるということです。

なお、個人的にむしろ感銘を受けた技術に関する「質的」インパクトは、 Nature 論文 Figure 4.b ですね。 value network や policy network だけでも、相当いけるっていうことは、 AI 界隈では大ニュースではないんですかね？

投稿:Decision Science |2016年2月 2日 (火) 12時44分

伊藤さんご紹介のプロ棋士レーティング見てみましたが、このランキングは、こと Fan Hui については不当です。というのも、彼は中国・日本・韓国と違ってヨーロッパのプロであり、 go4go.net でヨーロッパでの対戦が全く記録されていないからです。レーティングに使われているデータが、世界戦の棋譜データのみで、対戦相手が強すぎます。明らかに彼より遥かに格下の日本人棋士が、昔の対戦成績からレーティング上になっているのが見受けられます。このレーティングの信頼度は、私の知識から言って 200 位くらいまでは参考になりますが、それ以下は、サンプリング・バイアスがかかりすぎてまったく参考になりません。おそらく Fan Hui は正しくは 300位くらいと想像します。そして、それは現在の中韓の充実度を鑑みると相当強いです。

投稿:Decision Science |2016年2月 2日 (火) 13時32分

一つ訂正。
Alpha に関する Ke Jie の評価は、院生トップ程度って感じですかね。もっとも、中国の院生は日本のプロの相当割合よりは強いです。
今回の棋譜は相手が悪すぎたことも、それ以上の評価は不能の理由の一つってことで、私も完全同意です。

投稿:Decision Science |2016年2月 2日 (火) 16時14分

Decision Science氏のコメントがちょっと気になったのでコメントします
> おそらく Fan Hui は正しくは 300位くらいと想像します
これは何かデータに基づいて書かれているのでしょうか？

私もgoratingsのレーティングは使用データに問題があるので、Coulomのような権威のある（？）人物がこのようなものを公開し続けるのは有害なのではないかと感じていました。
しかしだからといってFan Hui氏が世界300位レベルの打ち手だとは私には思えません。

Fan氏の現状のEGFレーティングは、EGFのプロ制度で入段したShikshinやLisyと同程度です。直近のヨーロッパチャンピオンを三連覇してはいますが、Fan氏がShikshinやLisyよりはっきり格上だと考える理由はないように思えます。（なおFan氏のレーティングの計算には2013年以降で150局のデータが使われているようで、十分ではないにせよ、それなりの信頼度はあるのではないでしょうか？）ShikshinやLisyは、私の知る限りKGSでまともに9dになったことはないはずです。一方で日本のアマトップには、KGSで9dで打てる人はそれこそごろごろいるでしょう。（他にも、EGFレーティングを持っている打ち手の中では、去年特例で入段を決めたTormanenなども参考になると思いますが割愛します）世界アマ選手権などでは日本代表がヨーロッパ勢に苦戦するようになっており、時間設定の違いなども考慮に入れれば単純な比較はできませんが、Fan氏が日本のアマトップよりはっきり上で、例えば三村九段などと同格だというのはちょっと考えにくいように思います。
また、富士田明彦氏はtwitterでFan氏について、「そんなに楽に勝てる相手ではないと感じました。」と書かれていましたが、Fan氏が自分より格下である、との認識が伺えます。富士田氏のgoratingsでの順位は300位台です。
こういったことを総合して、自分は三村九段の「（Fan氏は）プロでは無くトップアマと言うのが正しいだろう。」というツイートは一応妥当なもので、300位はちょっと考えにくいと判断します。Decision Science氏が何か根拠を持って書かれたのなら、伺ってみたいものです。（念のため補足しておくと「トップアマ」は、少なくとも短めの持ち時間の碁に関して言えば、日本に四百数十人いるプロの半分よりは上と考えてよいと思うので、「プロでは無い」などと主張する必要もないとは思います）

＞伊藤さん
twitterで以下の発言を見たのでせっかくですからコメントしておきます
> tygemって２４みたく観戦したり他人の戦績みたりってできるの？
もちろん観戦も戦績や棋譜の閲覧もできますが、日本語版（東洋囲碁）の会員には無料だといろいろ制限があり、対局もポイントがないと自由に出来ません。英語版は対局、観戦、棋譜の閲覧などは特に制限なくできると思いますが、地合い推定機能が上手く使えなかったり、問題もあるようです。その他、クライアントの使いやすさ等に関しては好みが分かれるかもしれません。自分は両方登録して使い分けています。

投稿:HF |2016年2月 3日 (水) 20時22分

市販のソフト相手に、コンピュータ囲碁の大会に出て切磋琢磨せず、二段の人をプロと称している。欠陥があるプロ四段程度ではないか。

システム最適化の手法は知り尽くされているにも関わらず、ＺＥＮ程度というのが今回の記事を読ませて頂き、わかりました。

今の将棋コンピュータの手法を囲碁に導入して、アルファ碁よりはるかに強くなる事は難しいのでしょうか

投稿:カツ |2016年2月 4日 (木) 03時08分

>HF さん
レーティング 300 位くらいでは？　という私の発言はあまりにざっくりしすぎていましたね。ご説明、全て完全同意です。
同意くださったランキングの信頼度のなさのところで発言を留めるべきでした。
失礼しました。

というわけで、 Fan Hui 氏との棋譜の評価については、純粋に棋譜の質的内容の評価に留めるべきでしょうね。それでなければ、伊藤さんのおっしゃる「ヨーロッパチャンピオン」っていう名前のみ利用したプロパガンダと言われても仕方ないところもありそうです。

投稿:Decision Science |2016年2月 4日 (木) 03時49分

ズキュウウウン！

さすが伊藤さん!

おれたちにできない分析を平然とやってのけるッ

そこにシビれる!あこがれるゥ!

投稿:pugella β |2016年2月 6日 (土) 13時51分

そもそも碁と将棋は異質なゲームなので、将棋の経験則を持ち出されても困りますね。

ここ数年間COM碁が進歩しなかったのは、MCTSに用いる候補手を意味のある手に絞りきれなかったからです。
そのせいで、通常のゲーム制限時間内ではこれ以上強くなれないほど計算リソースを浪費していました。

そこを突破するためにgoogleが支払った膨大なコストは碁の複雑さ(合法局面の多さ)を反映したもので、
ここまで金を掛けてDCNNを鍛えることでようやくまともな候補手の連鎖をMCTSに投入できるようになった、
と考えるのが妥当でしょう。

その意味でAlphaGoとCS／Zenの間に横たわるレート差は、たとえ200〜300程度であっても
現実的な制限時間内ではマシンを強化しても埋められないほどの計算コストに匹敵しているのではないかと。

投稿:PEN |2016年2月 8日 (月) 00時12分

コンピューター囲碁の実力は、井山７冠戦があるここ数ヶ月に判明しますね。アルファ碁と韓国プロとの対決、ponanGo、ゴナンザ参加のＵＥＣなどで。

一方、将棋はポナンザと山崎プロの対決。ぜひともポナンザの再商品化、及びポナンザの大会出場継続を願います。

投稿:カツ |2016年2月11日 (木) 19時03分

アルファ碁、世界最強一角のセドルでも危ういと聞きました。
3月の対局が楽しみですね。

投稿: |2016年2月12日 (金) 00時08分

もし2012年頃の将棋ソフトのようにレーティングが年間１５０点位上がってなおかつ伊藤さんの推定通り現在のイセドル氏とアルファ碁の差が３００点位だとすると２年後に追い付くことになりますね。それでも私が思ってたよりずっと強くなるのが早いし楽しみです。

投稿: |2016年2月22日 (月) 06時52分

いちおう予防線を張っとくとw、300差というのは私が推定してるわけじゃなくて、Google論文がそう主張してるので仮にそれを信じるならば、ということです。300差の根拠は「Fan Huiに8勝2敗だった」（非公式の5局も含めて）ということだけのようなので、根拠としてはかなり弱く、あまりあてにはならないかと個人的には思っています。

投稿:伊藤 |2016年2月22日 (月) 08時58分

人間は互先で人間と勝負することを前提として勝つために訓練してるから、対コンピュータ戦で実力を発揮できなかったんじゃない？くせとかあるらしいし
んでもってAlphagoはいくらでも相手によって自己最適化できる、対ソフトの方がずっと最適化しやすいでしょ、だから対ソフトはいくらでも得意になれる。
対『最適化済みソフト』なら完封してもぜんぜん不思議じゃないよね

だから人間の苦手とAlphagoの得意が噛み合わさって歪んで見えるんじゃないのかなって思った

Alphagoは対ソフトが超絶得意で、
人間に対してはただのソフト最強（現時点）なわけだけど
何に基準を置くかで全然棋力が変わっちゃうよね、今回はプロの方に基準を合わせたおかげで他のソフトが割を食っちゃったわけだけど
筆者はこのわかりずらい歪みをどうすべきだったと思うか気になるな

筆者の言う旧ソフト基準だと、Alphagoが過大評価気味になっちゃうし
棋力とかの記述ゼロだと
戦績から計算されてまたまたAlphagoが過大評価気味になっちゃう
戦績とかも全く書かないとさらにおかしなことにってなっちゃうよね
どうしたもんかね...(~~:)
なんだかんだでこれで最善っぽいと僕は思っちゃうけどね

投稿: |2016年2月25日 (木) 18時55分

有料でもいい記事ありがとございました。とても楽しく読めました。

同様に誤解に基づくものとして、「囲碁は他のボードゲームよりも1手あたりの合法手や局面数がはるかに多いため、人間に勝つのは難しい」というものがありますね。

囲碁の場合の数としての規模が大きいのは確かですが、それは人間にとっても同じことです。

コンピューター囲碁が将棋のそれよりも難しいとのことですが、それは単純に囲碁の性質によるものと思います。

人間の思考がDNNで近似されるものならば、古典チューリングマシンで（効率の是非は別にして）実行可能であり、後はアルゴリズムの成熟度や問題に対する効率性の問題であり、場合の数そのものは関係ないはずですから。

投稿:a |2016年3月 6日 (日) 00時09分

どうあれ、私はイ・セドルとの対局が楽しみです。
頂上決戦を見られるなんて夢みたいです。

投稿:健 |2016年3月 7日 (月) 10時14分

さて、α碁が勝ちました
次の記事を書いてくださいね

投稿: |2016年3月 9日 (水) 16時40分

この記事のどこまでが正確で、どこからが憶測・誤りだったんですかね？
今ならより正確な記事が書けそうですか？

投稿:R |2016年3月 9日 (水) 17時50分

セドルさん初戦落としたか・・・・・・
想像以上にアルファ碁は強いみたいですね。

投稿: |2016年3月 9日 (水) 18時37分

というよりも、誇大広告じゃなくて
googleのやつ過少申告です

自己対局の繰り返しでどこまでレベルの底上げをしたのか？
現在のアルファ碁のレーティングは、
ここに挙げられているグラフ表記よりも相当上なのではないでしょうか？

投稿: |2016年3月 9日 (水) 18時44分

誤った認識からは誤った結論しか出ない

投稿: |2016年3月 9日 (水) 21時01分

2016年2月 2日 (火) 08時40分さん

まあ、そういうことだったんですね。

投稿: |2016年3月 9日 (水) 21時15分

強い人は無駄な手を考えないんですよ。

投稿:PEN |2016年3月 9日 (水) 23時52分

正しくは「AlphaGoが過小広告ぎみな件」ですね

投稿: |2016年3月10日 (木) 18時04分

セドル2連敗、心が折れてなければいいんだが・・・・・・

投稿: |2016年3月10日 (木) 18時16分

『むしろ人間側に水平線効果が発生している』という

残酷な結論が確定するまで、あと三局しかない・・・

投稿:PEN |2016年3月10日 (木) 20時56分

AlphaGoは純粋に強かった。
人間はそれを認めたくないので、ミスリードしてしまいがちだけども、結果を出されてはしょうがない。
考えをあらためて、キチンとした考察をしてほしいな。

投稿: |2016年3月10日 (木) 21時26分

NOW YOU BELIEVE？

投稿: |2016年3月10日 (木) 21時55分

早く次の記事を！

投稿: |2016年3月10日 (木) 22時16分

あのアホみたいに強いセドルがAIごときにボコボコとか未だに信じられん

投稿: |2016年3月10日 (木) 23時56分

持論だが、テレビゲームには必ずバグはあると思う。人間が勝てるかいなかは、それをみつけられるかだと思っている。あとポナンザをパクったのではと思っているのだが。

投稿:カツ |2016年3月11日 (金) 00時04分

思った以上に強かったですね
正直手合い違いにすら思えます

投稿:　 |2016年3月11日 (金) 00時05分

グーグルに晒し上げられてるぞここ

投稿: |2016年3月11日 (金) 00時56分

結局、トッププロの棋士がAIに負けて欲しくないというとんでもなく
分厚い願望フィルターを通した上での、非常に偏った分析だった
ということですね。

投稿: |2016年3月11日 (金) 02時05分

プロ棋士の過去の棋譜から勝率を計算して、記憶させたマシンが、ある程度の実力になった時点でマシン同士の対局を繰り返し精度を上げるという手法と書いてあるので、マシンは日々強くなりますし、理論上ほぼ人間は、他の人が言うようにバグのようなものを発見して突いていくようなやり方でしか現状勝てないのかもしれません。しかしながらそれすらマシン同士の検討の中で解決されていて、既に人間では勝てない域まで達しているのかもしれませんね

投稿: |2016年3月11日 (金) 09時07分

まだ終わってませんが間違ってても良い記事だったと思います
巨大資本（が結集させた才能と資金）の持つ暴力的なまでの恐ろしい力
自分たちが努力してきた成果があっさりとねじおられる恐怖
それは日本で研究や開発に携わっている人間なら誰もが心のうちに抱えている不安だと思います
今後の結果次第ではそれをまざまざと見せ付けられることになるのかもしれないですが
その都度必要な変化を遂げながらも何かをがんばり続けて欲しいです

投稿: |2016年3月11日 (金) 10時03分

>でついでに言うと、もしイセドルに勝てるレベル＝tygemで無双できるレ>ベルになってたらカミングアウトすると思う（bonkrasのようにｗ)。

この辺の理屈というか感覚が全く理解できなかったのですが、私の感覚がグーグルに近くて良かったです。さすがグーグル。

投稿:　 |2016年3月11日 (金) 10時39分

Googleに負けても大丈夫ですから

投稿: |2016年3月11日 (金) 16時31分

みなさんいろいろコメントありがとうございます。
なんか誤解されてる方がけっこういらっしゃるようですが、別にこの記事自体は何も間違ったこと書いてないですよ。
「AlphaGoのレーティングが3200」はGoogle自身が論文に書いている話で、私は単にGoogleがそう言ってるのだからそれを前提としているというだけです。
「誇大広告」と言ったのは、「CS/Zenの棋力を不当に低く評価し、(3200への)改善を実態以上に大きく見せかけている」
という点で、この点は厳然たる事実です。その意味で「誇大広告」は全く間違ってないです。
対局で判明した（＆皆が驚いた）のは「AlphaGoのレーティングは3200よりかなり高いらしい」という点ですが、これはGoogleが過少広告というよりは、論文を書いた昨年10月の時点から開発が進んだ、てことでしょうね。

投稿:伊藤 |2016年3月11日 (金) 16時43分

なるほど、自己対局でどんどん強くなるらしいから上がってて当然なんですね。
goratingsによると、セドル先生のレーティングが3521

アルファ碁の現在の実力をレーティング換算すると
3600、3700ということもあり得るのでしょうか？

5連敗なんてことになったらと思うと……
セドル先生が巻き返してくれれば3500くらい……？

アルファ碁の実力は現在どのくらいだと思われますか？

投稿: |2016年3月11日 (金) 20時22分

>グーグルに晒し上げられてるぞここ

どこどこ？URL希望

投稿: |2016年3月11日 (金) 21時18分

勝った方が賞金を貰えるとの事で、次負けたら終り？
終わりで無く、５連敗したら、セドル悲惨。
次どうする、囲碁界！！！
次鋒、井山か。
ソフト貸出か。
またはソフト化か。

投稿:カツ |2016年3月11日 (金) 22時05分

日本の開発者の評価が爆下げになったのは間違いない。
悲しいけどこれは冷静に受け入れなくては。

IT、AI分野は米英に逆らっても仕方ないという
ぼわーんとした敗北感もある。

投稿: |2016年3月12日 (土) 09時34分

ソフト貸し出しはおかしいだろ。
ソフト慣れしてないとか理由として成り立たない。

他の棋士が井山先生と対局するとき、
井山慣れしてないから本番前に練習試合させろ
って言ってるようなもん。

投稿: |2016年3月12日 (土) 11時59分

やっぱり、将棋界の時のように、ソフト貸出し、変更なし、マシン制限あり、にしないと不公平でしょｗｗｗ

投稿: |2016年3月12日 (土) 12時16分

将棋は、新規ファン開拓の興業としてニコニコが仕切ってるから、こうはならない

囲碁は、googleの人工知能の宣伝として囲碁が使われているだけ
だからこんなにも辛辣としている

投稿: |2016年3月12日 (土) 17時17分

アルファ碁が3連勝しました。
ソフトの弱点と言われたコウも完璧でした。

コウに強いというのも相まって最強に見える。

投稿: |2016年3月12日 (土) 17時28分

>ソフト貸し出しはおかしいだろ。
>ソフト慣れしてないとか理由として成り立たない。

言いたいことはわかるが、人間とソフトでは野球でいうところの右投げと左投げくらい差がある
右投げの投手しかいない国で、ホームラン王の選手がいきなり左投げの投手と対戦して負けたからといって実力が劣っているとは言えない
実際にテニスでは実力的に劣っているサウスポーの選手が勝ってしまうことがある
特に読み合いのゲームでは相手がやりそうな手を予想して先読みするので、実力が同程度の場合相手を知らずに戦うと格下が連勝してしまうことはママあるので、貸出が不公平とは言えない
格闘ゲームで新キャラが追加された直後に相手を知らずにやるのと、知った上でやるのとでは、同じ実力でも結果が違ってくるのは分かると思う
もっとわかりやすく言うと、試験の前に過去問解くのと同じ。全く同じ問題は出ないけど、実力が同じなら過去問をやったのといきなり本番では合格率が違う

投稿: |2016年3月12日 (土) 20時59分

貸出が（ドワンゴは決して認めないが）厳然としたハンデなのは、その経験による利益を一方のみが享受できるという点にある（局語学習等である程度はソフト側も対策出来るかもしれないが）。

例えて言えば、対局相手を攫ってきて暗示にかけて、
癖・弱点等を徹底的に研究したうえで「相手の記憶を消して」対局に臨むようなもの。ハンデそのもの。

相手の傾向を知るということの重要性については同意するけれど、それはAI同士の棋譜を棋士のそれと同程度に公開すればいいだけ。

バグ探しとかしょーもないことやってる将棋界に比べて、囲碁界は潔い（嵌め手で途中棄権は子供っぽいけど、プロ棋士がそれを恥も外聞もなくやるようじゃ、もう敵わないと公言しているようなもの）。

興行としては、ハードウエア制限のハンデと合わせて、計算してかどうかうまいところで調整してるなぁと思うけどね。

投稿:a |2016年3月13日 (日) 01時42分

> goratingsによると、セドル先生のレーティングが
> 3521

> アルファ碁の現在の実力をレーティング換算すると
> 3600、3700ということもあり得るのでしょうか？

現時点でも簡単な推定は可能。例えば、AlphaGoの勝率をθとして、その確率分布をベイズ推定する。

仮定：
　対局前の事前分布はベータ分布でα = β = 1の
　一様分布（期待勝率E(θ) = 50%）。

　色々な状況を考慮すればもう少しまともな事前分布を仮定できるかもしれないけれど、囲碁に詳しくないため。昨年10月からの進歩が大きいことも考えれば、
まあイーブンで始めてもよいと考える。

もちろん、現時点で3局と対局数が少ないので事前分布の影響が大きく、推定は参考程度の精度。

で、3/12時点でAlphaGoの3勝0敗なので、α = 4,
β = 1に改訂されるから、確率分布は単純に
P(θ) = 4θ^4。

よって、現時点での推定結果は以下のとおり。

　・期待勝率E(θ) = 80%
　・θの95%CI：　55%～99%

上記に対応するElo ratingは、Sedol3521に対して、

　・期待レーティング += 240で、3761
　・レーティングの95%CI：　+= 35～798で、
　　3556～4319

個人的には今日の放送で囲碁棋士が手合い違い？と言っていたことなどを考えると期待値よりは上の可能性すらあるかも、と。

投稿:a |2016年3月13日 (日) 02時15分

うーん。
やっぱり貸し出し正当化には納得できない。
本当に強ければ、なんだろうと勝てるだろう。

もしソフトの打ち方に対応できないとすれば、
それは本人の打ち方に問題があるからだろう。

正着手を打ち続ければ相手がどんなうち方してきても
関係がないわけだし。

投稿: |2016年3月13日 (日) 02時52分

解説自体はよいものだったと思います。情報が限られたなかで先入観や願望が混じってしまうのは仕方がないし、alphaGOの解説ができるとすればこの解説を書いた方もその一人だとおもうので、一度や二度読み違ったからといって素人がワーワーいうのを気にする必要はないと思います。人の揚げ足をとるような人間がうようよいるからブレークスルーが生まれないわけですから。

投稿: |2016年3月13日 (日) 05時17分

"495戦494勝だった!" 誰に負けたかな。すごく知りたい

投稿:yao |2016年3月13日 (日) 05時31分

最初の1戦目くらいで負けたんじゃね？

アルファ碁は打つほど強くなるから、
回を重ねるごとに勝つのが無理ゲーとなっていく。

最初のほうは今ほどつよくなかったそうだし

投稿: |2016年3月13日 (日) 12時29分

訂正
s/95/90/g

投稿:a |2016年3月13日 (日) 13時12分

セドル先生勝ったよ！
モンテカルロの弱点は健在だったんだ！

投稿: |2016年3月13日 (日) 17時46分

セドルが一勝し、良かった。負けたら、影響が大きすぎるので。
ハードの規模、賞金額、及びグーグルが目標達成した事から、アルファ碁の再戦は厳しいですね。

アルファ碁がプログラムを公開してくれたら、コンピュータ囲碁の進歩に大きく貢献するかもしれません。

投稿:カツ |2016年3月13日 (日) 18時56分

コメントで、
「　「誇大広告」と言ったのは、「CS/Zenの棋力を不当に低く評価し、(3200への)改善を実態以上に大きく見せかけている」
という点で、この点は厳然たる事実です。その意味で「誇大広告」は全く間違ってないです。」
とおっしゃっていますが、「厳然たる事実」という用語の使い方を根本的に間違っていらっしゃいますね。あなたのレーティングなどについての記述は著しく多くの「推定」を含みます。
誇大広告との「論」（別にこれが悪いとは言いません、当時の不完全情報であれば、そこそこ知的におもしろい論で「あった」とは思います）は、あくまでも論です。

伊藤さんの、それこそ「厳然たる間違い」を逐次指摘していきましょう。

Fan Hui 氏との対戦当時の棋譜の質的な内容を見ても、人と異なり体調などでめちゃくちゃにレベルが時折下がるということがなさげなことを考慮すると、互先の勝率はうなずけます。当時の Zen などは確かに KGS 6d くらいなので、普通に Nature 論文のレーティングでいいんじゃないですか？これは私が申し上げました。どう考えても、Fan Hui 氏レベルに、あの時間設定の真剣勝負で当時のバージョンの Crazy Stone などが19路で勝利することは全くあり得ないと思います。確かに「レトリック的には」「最弱の女流とかを選べば」プロに勝つことは Zen とかにも可能であったと思いますが、ヨーロッパチャンピオンに勝つことは全く不可能であったと思われます。最弱プロを対戦相手として選ばなかった DeepMind は賞賛されるべきで、棋譜の内容がプロから酷評されるものでなかったことも、それを物語ります。

また、どなたかのコメントにニュアンスとしてはありましたとおり、Crazy Stone　などの置碁については、武宮さんとかに勝ったからといって、 KGS 9d とかよりレベルがはるかに高いと一概には言えない。依田さんが電聖戦の後の非公式対局で4子で　Crazy Stone をつぶしたとかいう話もあります。想像ですが、電聖戦での棋譜の内容を私が判断する限りでは、 KGS 9d レベルなら、打ち方のパターンに慣れれば、十二分に4子で互角に戦うチャンスがあると思います。要は、とりわけ置碁についてはデータが少なすぎて正確なレーティングが全く出せないでしょう。つまり、伊藤さんのレーティング推定のほうが実態とずれていて、 Nature 論文のレーティングの方が、今回の Lee Sedol さんとの対局などを鑑みると、置碁についても相対的にはコンピューティング資源の不公平などがない自然な推定に見えます。（不正が全く無いというつもりはありませんが、伊藤さんのレーティング推定の誤差のほうが相対的におそらく遥かに大きいと言っています）

さらに、質的なことも、まさに「推定」されています。モンテカルロからの飛躍がそれほど大きいと「思えない」と。記事の2）と書かれているところです。結局 policy network と value network によるモンテカルロの補完が伊藤さんの想像を遥かに超えてすごかったと認められてはいかがですか？

まとめれば、極めて不完全なデータに基づく「論」をよく「厳然たる事実」と言い換えられますね。。。
今回の Lee Sedol さんとの対局結果を踏まえますと、ますます明らかに、伊藤さんの記事のほうが不当な過少広告と思います。
当時のバージョンでの Nature 論文にあるレーティング差の方が、「事実」という言葉を使うなら、事実によほど近いと思いますね。ちなみに、この「思いますね」というのも推定であり、単に「論」に過ぎませんが、無知の知の分だけ、伊藤さんの言葉遣いよりよほど健全と思います。

投稿:Decision Science |2016年3月14日 (月) 12時39分

Deep Learning で大きく向上するのは、布石～中盤の途中までで、それ以後は、MCTS （MonteCarloTreeSearch) が主役となると思いますが、MCTSの部分は人間による作りこみの部分も大きく、第４局を見る限り、ZenやCrazyStoneの方が一日の長がある様に思えました。

Zenチームによる挑戦が楽しみになりました。

布石で離されるとどうしようもないですが、そこそこの分かれなら、Zenチームにも勝機もある様に思います。

投稿:masa |2016年3月14日 (月) 14時04分

Decision Scienceさん

先に書いたコメントを全く理解されていないようですが、もう一度だけ反論しておきます。
まずCS/Zenレーテイングについてですが、これは「事実」です。レーテイングは（公式の）勝敗結果から機械的に計算するものです。4子で2500は明らかに過少です。
本記事では、「AlphaGoが(Googleの主張する3200より)弱い」などとはどこにも書いていません。CS/Zenを過少評価し、それによって対比として改善幅を大きく見せていることを「誇大広告」と言っているもので、何ら間違いではありません。それは、今のAlphaGoが10月時点より強いからといって消える事ではありません。
この件についてはこれ以上議論しても無駄だと思いますので、議論はこれまでとします。

投稿:伊藤 |2016年3月15日 (火) 09時34分

まあまあ。揉めるほどにAIが肉薄あるいは追い抜いたということで。

結果、AlphaGoの4勝1敗となりましたので、確率を更新しておきます。

以前の投稿で上下のtail幅を5%にしてたり、次数の-1をポカしてたりしてましたがorz、
最後にまとめておきます。

Sedol: 3521
AlphaGo: 3680 (95%CI: 3420～4059)

P(θ) = 30*x^4*(1-x)　＠α = 5, β = 2
E(θ) = 5/7 = 71.4%
θの95%CI: (0.358765, 0.956728)

投稿:a |2016年3月15日 (火) 21時45分

関係ない？けど、goratings.orgでAlphaGoがレーティング
3586で世界ランク2位になっていてﾜﾛﾀｗ

こちらはWHRで計算しているのでちょっと違った結果になっています。恣意的な事前分布には依存してませんが、いずれにせよ局数が少ないので不安定だとは思いますが。

投稿:a |2016年3月15日 (火) 22時51分

伊藤さん

> 別にこの記事自体は何も間違ったこと書いてないですよ。

とのことですが、

> 結論１）Google論文は「従来ソフトよりレーティングで約1000上回った」と主張するが、実際には技術的改良による向上分は200程度と思われる。この改善幅は、コンピュータ将棋では毎年実現されていたのと大差ない程度の幅にすぎない。

この結論に関しては、明らかに間違っていると思いますが。

投稿: |2016年3月16日 (水) 14時07分

1月末に出たGoogle論文は、昨年10月時点でのAlphaGoについて記しています。そのバージョンに関して「技術的改良による向上分は200程度」は正しいです（多少の誤差はあるでしょうが）。

3月にセドルに勝ったバージョンは、10月時点とはかなり変わっています。Fan Huiに8勝2敗の10月バージョンがセドルに4-1で勝てるわけはないですよね。Google自身が「(10月バージョンの)レーティングは3200程度」と主張していますが、3月のバージョンが3200とは誰も思わないでしょう。

投稿:伊藤 |2016年3月16日 (水) 19時16分

2016年３月１６日19時16日のコメントは伊藤さん正しいと思いますが、
そうなると5カ月でレート400だか500だか上げるGoogleも大概が恐ろしい
連中だわ。1年で見たらAlphaGoはナンボあがったんだ？

投稿: |2016年3月16日 (水) 19時45分

今でもグーグルが誇大広告だとこれだけの長文で指摘する意義はあったと思いますか？

投稿: |2016年3月16日 (水) 21時48分

意義あったと思うよ。AlphaGoの技術はたしかにすごいとは思うけど、10月時点でそれほど強くなってなかったのを、グーグルは誇大広告でさも強いように見せかけようとした、ってことがよくわかった。技術のすごさと、その会社が信頼できるか、応援したいか、は別。グーグルは信用できないことを指摘したのはこの記事の大きい功績だよ。

投稿: |2016年3月16日 (水) 22時38分

Zen、CS等はハードが同じなら昨年10月時点でファン・フイに対して
互先で勝率50%だったということですか

作者に聞いてみたいですね
いや、ファン・フイがそれらのソフトをプレイすれば分かりますね
ハードが同じでない場合は勝率20%ぐらいですかね

投稿: |2016年3月17日 (木) 03時16分

修正後の数値見た感じ、
クレイジーストーンとＺＥＮが３２００くらいなので、

アルファ碁でなくても、
伊田先生くらいの実力はあるってことなんですね。

投稿: |2016年3月17日 (木) 15時48分

ポナンザ山本がTwitterで「つらい」とつぶやいてますね。
正直、伊藤さんも同じ気持ちでしょう。

Googleの広告が過大だったかとかいう、不毛な議論はやめましょう。
もう将棋や囲碁などの完全情報ゲームでは勝負がついたんです。
次は実社会で役に立つプログラムを作りましょう。

投稿: |2016年3月18日 (金) 00時21分

毎年レーティングが200程度あがるから、それくらい誤差だと書かれてますが、その中に占めるPCのスペックアップはどの程度なんですかね？
他のソフトのスペックをアルファ碁と同等にしたらと仮定しても、スペックに頼らずにレーティングが200上がっているのは、誤差と言える範囲なのでしょうか？
もう少し公正に考える必要はないですか？
まあ、googleが10年の差の少なからずの年数を資金力で埋めたことに関しては否定しませんけどね…
Deep learning 使ってもあの馬鹿げたスペックがなければ学習に何年かかっていたことか？
んでもって、結果が、そんな先になる学習を実行できる開発者や組織があるのか？
そこを、もう少し評価しても良いと思いますよ

投稿: |2016年3月18日 (金) 01時46分

今回のアルファ碁、
1200とかいうCPU使ってるんでしたっけ？

将棋のポナンザとかが家庭用PCということを考えると、
アルファ碁のレーティング上昇はスペックによるものかもしれませんね。

投稿: |2016年3月19日 (土) 14時54分

「何が書いてあるか、何は書いていないか」が正確に理解できない人が多くて大変ですね

投稿: |2016年3月21日 (月) 03時38分

コンピューター囲碁は一応終わりました。優勝したＺＥＮはトップアマクラスとの事です。

井山七冠マジック２と電王戦ポナンザ全勝か、楽しみです。

投稿:カツ |2016年3月21日 (月) 17時21分

結局
google凄い、AlphaGo凄い
だけがデーんと残るんです。

投稿: |2016年3月22日 (火) 22時23分

zenとcrazy stoneはヨーロッパチャンピオンより強いです。
アマレベルということはあり得ません。

http://aleag.cocolog-nifty.com/.shared/image.html?/photos/uncategorized/2016/01/31/alphagomodified.png
の画像を見ていただければわかりますが、
zenとcrazy stoneはアルファ碁レベルの強さがあります。

ちゃんと記事を読み込んでませんね。

投稿: |2016年3月23日 (水) 18時04分

AlphaGoレート4500に対し是非苦言を！！

投稿: |2016年3月26日 (土) 13時59分

井山七冠マジック１で４月１４日対戦です。
電王戦は第１局が４月９、１０日、第２局が５月２１、２２日です。
楽しみです。

投稿:カツ |2016年3月27日 (日) 23時29分

4500ってのはこれでしょうか。
https://twitter.com/tadctw/status/713268724698984449
4500だなんて言えるわけないですね。それならセドルには5-0でなくてはいけないので。やっぱりGoogle/Deepmindは虚言癖あるんだなぁｗ　改めて本記事の正しさが証明された形ですね。

投稿:伊藤 |2016年3月28日 (月) 12時19分

囲碁初心者の私ですが、AlphaGoとイ・セドル九段の対決で
興味を惹かれ、「コンピューター囲碁」（美添,山下,松原）を読んだり、
いろいろ調べているうちに、こちらの記事を拝読しました。

囲碁AIの本当のブレイクスルーはモンテカルロ木検索であり、
並列化や自己学習はそれを強化するが本質的な進歩ではない。
googleは資本投下で強化を成し遂げたという理解で
あっているでしょうか？

投稿:えぼし |2016年3月28日 (月) 14時51分

伊藤さんには珍しく感情的な発言が笑
計算してみてください、セドルとのレート差1000としても五連勝する確率は９８％ですよ。
５－０以外はありえない、って言い切るほどではないでしょう。

それはともかく、たぶんv18がv13に勝率0.9998（レート差1500）というだけで、絶対値に関しては信憑性ないでしょうね。満遍なく相手用意しないと相性の寄与を消せませんが、まともに戦える相手v13~17？くらいしか居ないのでどうしようもないですな。

投稿: |2016年3月28日 (月) 23時05分

・置き碁のレーティング評価は明確でない
（今回人間は囲碁を全然わかってないことがより明らかになりました）

・レーティングは率の問題で、セドルが勝つ可能性だってゼロではない
（実際４戦目の勝利は早い段階で勝負ついたと言われるぐらいギリギリで勝った）

これでもなお誇大と言い切れるもんなんでしょうか？

私は４戦目は空気読んでわざと負けたんじゃないかと思ってるぐらいですけどｗ

投稿: |2016年3月29日 (火) 00時09分

「(レート差1000でも5戦中1敗する確率が）ゼロではない」ことと
「4-1の結果からレート差1000と*推定する*」ことは別ですよ。
前者はその通りですが、後者をやるのはただのバカです。

投稿:伊藤 |2016年3月29日 (火) 10時02分

グーグルは４－１だからレート差１０００と推定してるんですか？
違うでしょ

伊藤さんが「４５００ならセドルが５－０なはずだと断言している」ことに対する反論として挙げたことですよ。

いずれにしても結局、言い切れるものなのかという質問の答えはいただけてないみたいですがそれはどうなんでしょうか？

投稿: |2016年3月29日 (火) 19時43分

私が言ったのは「４５００ならセドルが５－０なはずだ」ということではないです。「4-1という事実を前にして4500と推定するのはおかしい」ということです。
まあこれも、どうせ何をどう言っても納得しない人はしないのでしょうから、これ以上議論しないことにします。

投稿:伊藤 |2016年3月29日 (火) 23時57分

AlphaGo vs Gonanzaが実現したら会社休んで
Gonanza応援する。

投稿: |2016年4月 2日 (土) 11時54分

レートの絶対値の信憑性に関しての話題が上がっていましたが、
トッププロでも年間100にも満たない対局の結果から出される人間のレートよりも、相手が偏っているとはいえ一日だけで数万もの対局結果から算出されるAlphagoのレートの方が絶対値に関しても信頼できたりして。

投稿: |2016年4月 2日 (土) 22時42分

虚言癖ねぇ…
レート4500のスライドですが左側に自己対戦の結果からの推定値だと書いてありますよね。
"s"しか見えてませんが"self-"ですよね？
現場でも今回のセドル戦の結果からの推定ではないよって説明しているはずなんですが。
自己対戦を何百回やった知りませんが、それにたった5回分のデータを混ぜてもレートなんて大して変わらないでしょうし。
混ぜないで自己対戦だけでグラフを描くのは至って普通じゃないですか？

投稿: |2016年4月 8日 (金) 00時17分

>自己対戦の結果からの推定値だと書いてありますよね

4500を示唆する結果（自己対戦）と3500強を示唆する結果（セドル戦）があるのに、都合のよい方だけを取って推定して、都合の悪い方を無視する、というのは明らかに誇大広告ですね。都合のよい方が嘘でないからいいんだ、というものではないです。

あと、コンピュータどうしの対戦と対人間の対戦とでは、前者の方が信頼性が低いというのは将棋でもよく知られた話です。理由は、コンピュータには固有の弱点があるのですが、相手もコンピュータだとその弱点をつけないからです。同じような読み筋どうしで戦うと、単純に読みの深い方が勝つ。だけど人間はコンピュータの読まない手を打つことがあり、そうするとコンピュータはあっさり負けたりする。セドル戦４局のワリコミみたいなやつですね。そういうことがあるので、単純な試合数ではなく、対人間の方がより信頼できるレーティングになります。

投稿:伊藤 |2016年4月 9日 (土) 10時40分

本質的でない事をだらだらやってる
レーティングなんて枝葉の話だと思うし
コンピュータに必ず穴があるというのも本質的な変化や機械学習を知らない故の発言だと思う

投稿:A |2016年4月 9日 (土) 14時22分

そもそも最初は既存ソフトのレーティングに文句つけてたんだからだったら既存ソフトのレーティングも人間との対戦含めて評価しろっつのw
言ってる事がブレブレで何の反論にもなってない

投稿:Aa |2016年4月 9日 (土) 14時28分

今ある定跡を超えた戦いみたいで、ポナンザ戦プロほぼ完敗になりそうです。来月の電王戦の棋譜が楽しみです。

ワリコミで負けた為、Ｒ４５００はプログラムミスの可能性が高いです。対局は今後無い以上、議論しても無駄と思われます。今は歴史的な出来事の井山七冠戦、ポナンザ戦で盛り上がりましょう！！

投稿:カツ |2016年4月10日 (日) 05時53分

ポナンザ関連の記事もおねがいしますね。恐ろしく強くなってます、ちょうど伊藤さんがボンクラーズで登場した折、チェスではハードの力に頼らずとも人間よりはるかに強いと言われてました。今将棋ソフトは、その段階に入ってると思います。

投稿: |2016年4月10日 (日) 08時14分

3500強を示唆する結果（セドル戦）は、みんな知ってます。

そのうえで、4500を示唆する結果（自己対戦）を出している。

これを誇大広告というんでしょうか。
単に自己対戦レートとして示しているだけでは？

投稿: |2016年4月10日 (日) 12時03分

セドルに勝った＝３５００オーバー

じゃあアルファ碁はどのぐらいのレートなんだ＝みんなの疑問

自己対戦の結果ですけど４５００です＝グーグルの解答

これを虚言癖というのはどうなんですか？

投稿: |2016年4月16日 (土) 00時00分

4/9 10:40のコメントの意味を全く理解せずに「自己対戦のレートだから誇大広告じゃない！虚言癖じゃない！」と叫んでる人たちは、自分が恥を晒してることに気付いた方がいいと思う

投稿: |2016年4月16日 (土) 10時58分

>自分が恥を晒してることに気付いた方がいいと思う

わからないので是非説明してください。

投稿: |2016年4月16日 (土) 15時48分

イセドルの１勝４敗を見事に的中させた山本一成さん（ＺＥＮプロジェクト参加）と、囲碁プロ棋士の大橋さんの対談を読みましたが、nature論文でＺＥＮのレートが２０００でアルファ碁と１０００の差があるということ、アルファ碁のレートが４５００であることを特に注釈なく話されてましたよ。

投稿: |2016年4月19日 (火) 10時19分

簡単でしょう、囲碁ソフトのレベルから電王戦の当初の勝率辺りを言っておけば、当たらずとも遠からずの理屈。もっともイ・セドルは、もっと勝てたとも言ってるので、この辺りも酷似してるかなという印象です。将棋もGPS600台で騒いだりしました、今思うと少し恥ずかしい時期を経験してます。アルファ碁を笑う資格はありませんよ。

投稿: |2016年4月30日 (土) 19時55分

勝利を目的にしたのでしょうね
多くを語るには知識がないので
個人的にはある意味世界一（まけたらただだから）のオセロソフト作ったことあるのですが　誰も相手してくれないんだよ　ひどくない　白のみなのもまずかったなー

投稿:aa |2016年5月 8日 (日) 01時52分

今年のポナンザは去年のポナンザに勝率９割らしですよ
伸びしろのより大きい囲碁・アルファ碁が短期間で＋R1000出したって全然不思議ではないですよね？それでも誇大広告なんでしょうかね。
感想をお聞かせください。

投稿:　 |2016年10月10日 (月) 21時27分

アルファ碁の最新バージョンが、
日中韓のトッププロを相手に60連勝したようです。

人類最強、柯潔プロとの対局も勝利・・・、
まだまだ、どんどん強くなって行くんでしょうね。

投稿:アルファつよい！ |2017年1月10日 (火) 14時59分