|
〜モンテカルロ法からの脱却〜 『ポナンザ』開発者の山本氏は、囲碁は将棋より難しいと語っている。(下記参照) 本当にそうだろうか? うわ〜、大風呂敷を広げちゃいましたね〜 私は自信がある。 将来、必ず、次の結論に至る、と。 すなわち、囲碁に有効だが、将棋には使えないアプローチが発見される。 そうなれば、囲碁ソフトのブレイクスルーが起る。 では、その答えは何か? この方法は、終局手数が無限大で、且つ、手数が進むと「場合の数」が拡大する将棋には通用しない。 しかし、最大終局手数が有限で、手数が進むと「場合の数」が減る囲碁には十分可能である。 と、思うのである。 どうです!大発見でしょう! えっ!? そんなことは、疾の昔(とうのむかし)試したよ! って? いや〜、遣り方が悪かったんじゃあないでしょうか。 『ボナンザ(Bonanza)』の機械学習や全幅探索も、それ以前にチャレンジして、 皆、一度は諦めていた方法じゃあないですか。 *----------*----------* 当文章は、コンテンツ配信サイトcakes(ケイクス)の記事を参照させて頂いた。 配信日:2016年4月6日 対談者メンバー 大橋拓文(以下、大橋) 〔略歴〕おおはし ひろふみ。昭和59年5月25日生。31歳。東京都出身。 日本棋院所属、プロ六段 山本一成(以下、山本) 〔略歴〕やまもと いっせい。昭和60年生、30歳。 将棋最強ソフト『ポナンザ(Ponanza)』の開発者。将棋アマ五段。 東京大学卒業、東京大学大学院修了。 加藤貞顕(以下、加藤)インタビュアー 〔略歴〕かとう さだあき。1973年生、新潟県出身。43歳。 将棋マニア、囲碁初心者。 大阪大学大学院経済学研究科博士前期課程修了。アスキー、ダイヤモンド社に編集者として勤務。 『もし高校野球の女子マネージャーがドラッカーの「マネジメント」を読んだら』など話題作を多数手がける。 2011年12月に株式会社ピースオブケイクを設立。2013年9月、コンテンツ配信サイトcakes(ケイクス)を立ち上げた。 *-----* 山本: じゃあ、まずは、チェスと将棋と囲碁の違いについて話しましょうか。 将棋や囲碁がこんなに強くなったのは、コンピュータがデータから自分で学習する「機械学習」 という分野の研究が発展したからなんですけど、 一番最初に勝ったチェスのときは、機械学習は要らなかったんです。 山本: チェスというゲームは、人間が強さを記述することが可能だった。 言い換えると、言葉に還元することができたわけです。 でも、将棋はちょっと難しかったんですよね。 加藤:
機械学習が導入される前、将棋プログラムの強さがアマチュア四五段くらいで止まっていたころが ありましたよね。 それはつまり、人間が「将棋の上手な指し方」を、そこそこプログラムで書くことが出来たという ことですよね。 でも、将棋というゲームを書き切ることまではできなかった。 だから、それ以上強くならなかったわけです。 そして、囲碁はもっとややこしいんです。 そもそも何をどう書けば、囲碁というゲームを表現できるのか、全く解らなかった。 |
コンピュータ将棋考
[ リスト | 詳細 ]
|
『天使か悪魔か 〜羽生善治 人工知能を探る〜』が放送された。 話題性としては最高の選択。 タイトルも良い。 我らが羽生名人をリポーターに起用するなら、もっと深い考察の内容にして欲しかった。 では、どこが甘かったのか? 結論から言うと、 この一点だ。 *----------*----------* 【説明】 『ブロック崩し』のテレビゲームに「高得点を取れ」の命令だけでプログラムが勝手に学習して行く。 最初は球を撥ね返すことすら出来ない。 しかし、4時間程の自己学習で、初心者から熟練者へ進化した。 これが『ディープラーニング』だ。 だが、囲碁では、通用しなかった。 それで、囲碁棋士の15万局をコンピュータに記憶させた。 結果、従来は1億通りから1手を選択していたが、『アルファ碁』は6万通りから選ぶようになった。 しかし、この手法では『ボナンザ(Bonanza)』の機械学習とほぼ同じではないか。 『アルファ碁』同士で約3000万局対局させ、自己学習させた。(人間なら8200年かかる。) と説明するのだが、大規模にしただけにしか聞こえない。 私には、違いが理解できない。 前述の『ブロック崩し』の自己学習は、人間の遣り方を全く参考にしていないので、画期的である。 (これについては、昨年指摘した「将棋ソフトの純粋なアプローチ」ので参照願う。) 最終的に神様に勝つプレイを発見する可能性がある。 対して、『アルファ碁』は人間の棋譜をベースにした。 力任せに3000万局対戦させたところで、それは人間の考え方をベースにしているので、神様に勝てない。 *----------*----------* 【放送内容】 NHKスペシャル 天使か悪魔か 〜羽生善治 人工知能を探る〜 平成28年5月15日(日) 21:00〜21:49 今年3月、グーグルの開発した囲碁の人工知能が、世界最強と言われる韓国人の棋士に圧勝し、世界に衝撃が走った。 囲碁は、最も複雑なゲームで、人工知能が人間を凌駕するのはまだ10年はかかると言われる中での出来事だった。 このまま人工知能が進化していけば、どんな未来が到来するのか。 番組のリポーターとして世界各地を取材していくのは、将棋界・最高の頭脳、羽生善治さん。 圧倒的な思考のスピードと深さで将棋界に君臨し、日々、「人間にしかできないことは何か」を考え続けている。 人工知能開発の最前線を取材。 人工知能が人間に何をもたらすのかを探っていく。
|
|
『アルファ碁』を含め、コン君から学んだことがある。(注1) 私が小学生の頃、長嶋茂雄と並ぶ野球界の大スター王貞治。(注2) 現役当時、名うての投手が 「あのギョロ目で睨まれると、魅入られたようにストライクゾーンに投げてしまう」 と嘆いていた。 高尾神路九段は、李世乭(イ・セドル)九段に大変な「 気迫 」を感じた。 「 気圧され、それだけで1目2目弱くなった気がする 」と感慨深く語っていた。 「 対戦した者にしか分からない 」とも付け加えている。 (李世乭九段) その精神力抜群の李が『アルファ碁』との対局後、自分の心の弱さを嘆いていた。 打った手の善し悪しの反省ではなかった。 「 気迫 」とは一体何か。 人間の醸し出す「 気迫 」とは、具体的に何か。 私の思うところ、一番の発現の場所は、眼。 次に姿勢、息遣い、所作、振る舞いの順で続くだろうか。 その「 気迫 」「 精神力 」がコンピュータには、全く通用しなかった。 機械に心はないのだから、当然じゃないか? ところが・・・ 思い出されるのが、谷川浩司会長の名言。(注3) 「 まさか精神力の重要性をコンピュータに教わるとは思ってもいなかった。」 これは形勢が悪くなってからの粘り強さのことを表現したものだが、 恰もコンピュータに人間と同じ「 心 」が具わっているかのような話だ。 以上全ては、超一流たちの言葉である。 凡人の話ではない。 しかし、凡人である私が、簡単に結論してみる。 この感情的で最も悪影響があるのが、「怒」の感情だそうだ。 二番目は、負ければ面目が潰れるような場合。 三番目が悲観的過ぎたり、楽観し過ぎたり。 一番良い状態は、強い先輩の胸を借りるときの状態であろうか。 *----------*----------* 【注解】 注1.コン君 先崎学八段が、コンピュータ将棋ソフト及びコンピュータを「コン君」と呼ぶ。 流石、上手いもんだ。私も拝借させて頂くことにした。 注2.野球の王貞治 王 貞治(おう さだはる、1940年5月20日、75歳) 日本生まれ、台湾籍の元プロ野球選手・監督(読売ジャイアンツ監督(第12代)、福岡ソフトバンクホークス監督(第18代)) WBC第1回大会(2006)日本代表監督を務めた。 福岡ソフトバンクホークス株式会社取締役会長。日本プロ野球名球会顧問。 レギュラーシーズン通算本塁打868本を記録し、巨人のV9に貢献。 19年間本塁打30本以上、通算打率.301。 本塁打王15回。打点王13回。首位打者5回。三冠王2回。 1977年、初めて国民栄誉賞を受賞した人物であり、2010年には文化功労者として顕彰された。 注3.谷川浩司会長の名言 『第2回 将棋電王戦』(2013年3月〜4月)が閉幕し、全体記者会見(4月20日)の席上での谷川会長の発言。 「5対5の団体戦ということで、勝負に重きが置かれるかと最初は思っていましたが、5局すべてにドラマがありました。 私自身、特に印象に残ったのは第三局であり、通常は形勢が苦しくなると心が折れてしまう。 しかし、苦しくなっても、読み筋に穴が開いても、現時点での最善手を追求していく、 コンピュータにとっては自然なことかもしれませんが、なかなか人間には難しい。 精神力の重要性をコンピュータに教わるとは思ってもいなかった。」 *----------*----------* 【参照】 |
|
第26回世界コンピュータ将棋選手権は、二次予選で『ポナンザ』(Ponanza)を破った『技巧』 の初優勝が濃厚だった。 ところが、決勝リーグ戦では、『ポナンザ』が『技巧』に勝ち、去年に続いて優勝。 残念!『技巧』! では、決勝戦の『ポナンザ』vs『技巧』の対局を見てみましょう。 まあ、驚きの連続です。 人間では考えられない出だしから、更に考えられない展開へ。 【図1.27手目▲2四歩まで】 ここで、解説の菅井六段は△1二銀だろう、と。 そうすると、▲4六銀。 そこから△2三歩として銀冠に組める・・・かも、と。 ところが、後手『技巧』は、△1四銀! ▲4六銀なら、△2五歩と打つ魂胆だ。 強気だ! しかし、先手『ポナンザ』も負けては居ない。 ▲4六銀と引かずに、なんと、▲1六歩! 【図2.29手目▲1六歩まで】 えっ?! △3五歩と銀を取って、後手優勢なんじゃあないの? と、思ったら、なんと、なんと、後手は△4五歩! 【図3.30手目△4五歩まで】 さっぱり、理解できません! 菅井六段でさえ 「 理解するのに10年位かかるかも・・・」 と溜息を吐いていました。 図3以下 ▲3三角成 △同桂 ▲7一角 △5二飛 ▲1五歩 △6四角(図4) 【図4.36手目△6四角まで】 ▲1五歩に対して△6四角も理解不可能。 どうして、△2五銀じゃあダメなのか。 そして、なんと、先手は飛車を見捨てて、▲1四歩! 後手は当然△2八角成。 【図5.38手目△2八角成まで】 結局、『ポナンザ』が勝ったのですが、一体、どっちが、どこで形勢を損ねたのでしょうか。 変化する余地はなかったのでしょうか。 暇なときに、研究してみましょう。 *----------*----------* 【大会結果】 <二次予選> 1位、技巧、9戦0敗 2位、ポナンザ、8戦1敗 3位、NineDayFever、6戦2敗1分 <決勝> 1位、ポナンザ、7戦0敗、優勝 2位、技巧、6戦1敗 3位、大将軍、5戦2敗 二次予選と決勝を通算したら、『ポナンザ』と『技巧』は、共に15勝1敗の同星。 この2つのソフトが群を抜いていた。
|
|
第26回世界コンピュータ将棋選手権の二次予選が『ニコ生』で放映された。 毎年、勝又教授の独擅場だった解説。 今年は千田五段。(注1) いや〜、教授に劣らず精通していました。 フラッドゲイト(FloodGate)もよく覘いているし、各ソフトのレーティングも知っている。(注2) 適任でしたね。 『ポナンザ』(Ponanza)開発者の山本一成氏も「メッチャ、詳しいですねえ!」と絶賛していた。 『ポナンザ』は第3回将棋電王トーナメントで全勝優勝したんですよ。 そのとき『技巧』は5位でした。 半年前の話です。 信じられない!なんて叫びたくなりますね。 決勝戦へ進むのは、8プログラム。 上位3つだけ紹介します。 1位 9勝0敗0分 技巧 2位 8勝1敗0分 ポナンザ(Ponanza) 3位 6勝2敗1分 NineDayFever なお、『ボナンザ(Bonanza)』『ツツカナ』『やねうら王』は参加していません。 *----------*----------* 【注解】 注1.勝又教授、千田五段 「 勝又教授 」は、勝又清和(かつまた きよかず)六段の愛称。 昭和44年3月21日生、47歳 神奈川県出身、石田和雄門下 千田翔太(ちだ しょうた)五段 平成6年4月10日生、22歳 大阪府箕面市出身、森信雄門下 注2.フラッドゲイト(FloodGate) コンピュータ将棋連続対局場所 (floodgate)のこと。 サーバー上で将棋プログラムを連続対戦させる企画。(2008年2月9日公開) 対戦を重ねるとレーティングが計算される。 人間の参加も可。 持時間10分、秒読み10秒。 注3.レーティング 将棋のレーティングと言えば、大概『将棋倶楽部24』のレーティングを指す。 ここで千田五段の言うところのレーティングは、多分、フラッドゲイト(FloodGate)のものだろう。 いくつか示すと、 1位 ponanza、3700点 3位 Gikou『技巧』、3540点 4位 Yaneuraou『やねうら王』、3539点 10位 NineDayFever、3456点 恐ろしい点数です。
|





