|
空を飛ぶ夢をみた。 スケボーに似た空を飛ぶ遊具を発明した私は駅に向かう歩道の上空を颯爽と飛んでいた。 通行人は皆、驚きと羨望の眼差しで私を見上げていた。 駅に着き、待合室にいた男から質問を浴びせられた。 「あなたが持っているその素晴らしい発明品はいったい何ですか?」 私は答えた。 「いえ、ほんの玩具です」 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー 私が思いついた発明品はふたつあって、ひとつはコンピュータ将棋の改良案。
今、コンピュータ将棋の世界で懸案となっている問題。 2007年に行われた渡辺竜王とBonanzaの一戦http://blogs.yahoo.co.jp/yuzukijoutarou/8125901.html で、後手の渡辺竜王が指した△3九龍という手。ソフトにはいまだにこの手が指せないらしい。 詰めろ、詰めろの連続で迫る手順が読めなくて、「王手で取れそうな銀をみすみす逃がして、龍を金と交換する手はとても最善手とは思えない」 という判断になるのだろう。(したがってαβカットされる) http://d.hatena.ne.jp/tanase_yasushi/20100914 今日はこの問題の解決方法の話。 αβ探索は近似的に全幅探索と等しいが、完全に等しいわけではない。 ごくまれにαβウインドウの外に最善手が出てしまい、カットされるケースがある。 そこでカットされないように保護する手段をBonanzaの使用を前提として検討する。 無作為に選出した10万局面ほどの局面にたいして、一手目からαβカットを行う探索とαβカットを行わない全幅探索の差分を求める。 このようにして誤ってαβカットされたケースを濾過して収集する。 収集したミスカットの特徴(どのような特徴の局面でどのような特徴の手順がミスカットされたのか)を抽出する。 おそらく終盤では、大幅に駒損して相手玉の安全度を低下させる手順が抽出されるのではないだろうか? 抽出された特徴の手順に保護をかけると、通常7手目以降で始まるαβカットにたいしてある特定の手だけ保護することになるので、 これは意味的には選択的探索ルーチンの実装に等しい。 選択的探索ルーチンと言えば通常プログラマが手作業で行うものだが、学習でできるということになると無制限にいくらでも盛り込むことができる。 勿論、自然界では静止探索の条件や選択的探索の条件も学習で獲得されているわけで、当然、そのメカニズム(知識の獲得過程)が存在していると考えなければならない。 私が思いついたもうひとつの発明品はFXの必勝アルゴリズム。これは勿体無くて公表できません。 |

- >
- コンピュータとインターネット
- >
- コンピュータ
- >
- その他コンピュータ




