|
私が考案した跳躍探索、実証されていたようです。
まあ、これは複数ある実装案(別の実装案)のひとつで、最急降下法を用いた実装案の方ですが、
http://524.teacup.com/yss/bbs/1505
学習時の探索深さを一手深くするだけでレーティングが100点も上昇する目覚しい効果を上げています。さらにn手の深さに拡張し、反復学習すれば100点どころではないですね。
激指が一年でレートが400点も上昇し、他のチームのプログラムも同様にレートが上昇しているところを見るとその後、開発の主流になったようです。
私のオリジナルの実装案の方はアレンジした上で採用したプログラムがあるようですが、
それについては開発者の方が口を閉ざしているので、どのプログラムがそうだとは言いませんが……。
ソフト開発者の方々にしてみれば、非開発者の素人が考案した探索技法が大きな成果を上げたり、開発の主流になったりすることが、『面白くない』、あるいは『面子をつぶされた』と感じるケースが多いようで、一部の例外を除いては話題になりませんけれど。
--------------------------------------------------------------------------------
【関連記事からの転載】2009-05-02小宮日記より
深く読んで学習は精度上限があるのか?はたして
http://524.teacup.com/yss/bbs/1505
もっと深い最善応手手順だとどうなるか、どこでさちるのか、興味あります。
最近は見なくなりましたけど、某弓月という人が
CSAのオープン戦の掲示板にも書いていた理屈で
ボナメソ学習時に探索する深さを段々深くして反復学習をする跳躍探索学習という理屈を書いてました。
実験とか検証ぬきの純粋に理屈だけの話でしたが、
似ている気もします。柿木さんの自己対戦棋譜での学習のときも思ったんですが
元の理屈が検索しても見つからないので(^^;
ttp://blogs.yahoo.co.jp/yuzukijoutarou/23420521.html
n回反復学習で近似的に完全解にまで到達する可能性があると思われ、
実際は深くしながら反復学習するわけじゃなくて、
2手+静止で探索とn手+静止の比較ですかね。
だんだん深くしても、ローカルミニマムにはまるでしょうし
(発想的には反復進化に似てますけど)
|