将棋の茶店「芹沢鴨?」

将棋は大切な日本文化の一つ。将棋界が羽生(はぶ)さんを得たことは、天恵です。

全体表示

[ リスト ]

本格的な「コンピューター将棋ソフト 対 プロ棋士 」の戦いが、3月23日より行われる。(注1.)

私は、長らく人間が優位と思っていたのだが、最近、考えが変った。

その大きな理由は、「 人間の大局観は、統計的傾向がある 」と、ほぼ証明されたからだ。

そうならば、人間が自動車と42.195kmを競っても、何の意味もないのと同じように、将棋ソフトと

プロ棋士が争っても、いずれは、コンピューターが勝ち、対戦が無意味なものとなるだろう。


ただ、今回は、まだ、勝敗の行方は判らない。

今回の戦いのテーマは、「 人間の大局観 対 パラメーターの戦い 」である。


将棋ソフト『 ボナンザ 』は、機械学習機能により、プロ棋士の棋譜約6万局から最適な評価関数を得た。

機械学習というのは、要するに、駒と駒の関係を示すパラメーター(変数記憶域)が主役である。

沢山のパラメーターに数値を当て嵌めてプロ棋士と同じ指し手を指す値を求めていく。

そのパラメーターの数、5千万組にも上るらしい。(注2.)

その機械学習から得た評価関数により、ほぼプロ棋士と同等の指し手の選択が出来る様になった。


むかし、プロ棋士が、

「 コンピューターは、大局観を身に着け得ない限り、人間に勝てない 」(注3.)

そして、大局観は感覚的なもので、数値化は出来きないから、コンピューターに教えることが出来ない。

と否定的な意見だった。

ところが、大局観は、統計的に数値化が可能だったのだ。

どうして、そんな数値になったのか、その過程はプログラマーにも説明出来ないのだが、とにかく、

結果だけは、プロ棋士と同等の指し手の選択が出来る様になったのだ。

( まあ、プロ棋士も指し手の説明が出来ないのだから、同格か? )

すなわち、コンピューターは、大局観を身に着けたのだ。



数年前、『 ボナンザ 』は、渡辺竜王と戦って敗れた。

この時点でのパラメーターの数は、約1万組だったようだ。(注4.)

その評価関数は、プロ棋士に通用しなかった。

残念ながら、統計的手法では最善手を選べない、と思った。

しかし、その ボナンザ・メソッドは公開され、多くのプログラマーによって進化した。

その評価関数も洗練されて行った。

そして、昨年1月、故米長会長が対戦して、ソフトに敗れた。

どうも、プロ棋士に追いついたようである。


今回の戦いは、将棋ソフトの「 進化した大局観 」が本物かどうか、

現役のプロ棋士に通用するのかどうか、試される戦いである。

*----------*----------*
【補足】

1999年に放送されたNHKのETV特集『コンピュータは将棋を超えられるか』の中で、松原仁教授が

10年後にプロ棋士に追いつきたい、と語っていたが、ほぼ実現した。

特に、2006年に突然出現した将棋ソフト『 ボナンザ 』の作者、保木邦仁さんの貢献は大きい。

世界のパソコン業界で「 ビル・ゲイツ以前以後 」と時代区分されるように、コンピュータ将棋の世界では

「 ボナンザ以前以後 」で時代区分される。

*----------*----------*----------*----------*----------*----------*----------*
【注解】
注1.「第2回 将棋電王戦」 2013年3月23日〜4月20日に開催

注2.『 ボナンザ 』の機械学習による評価関数

 保木「機械学習と言いましても、人間のように学習しているわけではなく、単に、沢山のパラメーター
   に数値を付けてるだけでして・・・」
 勝又「ニュートン法みたいなやり方ですか?色んな数値を当て嵌めていって、近似値を求めていく。」
 保木「そうです。ニュートン法に近い・・・ある値を小さく小さくしていく。教師となるデータ(プロ棋士の棋譜)
 があって、それと同じ指し手を指すには、パラメーターの数値を何点にすればよいのか。
 (それを自動的に求めていくのが機械学習。)」
 「長所は、沢山の点数を付けることができる。まあ、それが短所にもなっていて、沢山数値があり過ぎて、
 (算出過程が)ブラックボックスになっていて、作った私にもどうしてそうなったのかの解らない。」
 勝又「今回のパラメーターは何千万位ですか?」
 保木「5千万個位です。」
 勝又「基本的スキームは、玉+他の駒2枚の3点間で1つのパラメーターとしているんですか?」
 保木「そうです。・・・一番最初の頃(2004年頃)は、基本的には2駒間でした。王様付近だけは
   3つ(3駒間)、と、王様を含まない2つ(2駒間)でした。」

  2012年5月3日〜5日の3日間に亘って開催された第22回世界コンピュータ将棋選手権
  が『ニコニコ生放送』された。その5月3日(13:00〜18:34)の録画。

  勝又清和六段(棋士、ゲスト解説)と保木邦仁氏(ボナンザ開発者)の対談。
  15:05〜15:35頃に話された「機械学習について」

注3.「 大局観という感覚的なものを身に着け得ない限り、人間に勝てない 」

 NHK ETV特集『コンピュータは将棋を超えられるか』 1999年8月4日放送

 インタビュアーのプロ棋士への質問
 「プロ棋士に勝てるコンピュータ将棋ソフトが出てくるでしょうか?」に答えて

 谷川浩司棋聖(当時)
 「コンピュータは今、結論を出して判断を下しているが、そうじゃあなくアバウトな部分、感覚の部分で
  判断が出来るようになると、かなり違ってくる(強くなる)」

 郷田真隆八段(当時)
 「数式では表せないような大局観。経験とか、見た感じで決めていくことなんですけど、
  それを養わない限りは、トッププロレベルに近づくことは難しい。」

 藤井猛竜王(当時)
 「定跡の部分とか最後の詰む詰まないはコンピュータはかなりいけると思う。
  途中の中盤戦の感覚が要求される部分はかなり大変なんじゃあないかと思う。」

注4.「パラメーターの数は、約1万個」

 松原仁教授
  「今までのソフトと『ボナンザ』は随分作り方が違って、保木さんて方が作られてるんですけど、
   彼自身、あまり将棋をご存知ないこともあって・・・
   (プロ棋士の)過去の棋譜から、評価関数、いわゆる形勢判断に必要な要素・・・
   彼は、1万位の候補って言ってますけど・・・それで学習させた・・・」

 『羽生善治特別対談・将棋を科学する。羽生善治×松原仁』 第1回 2007年04月07日配信
  『将棋ニュースプラス』で配信されていた番組。

*----------*----------*----------*----------*----------*----------*----------*
【参考】
 「Bonanza ボナンザ wikipedia」

閉じる コメント(0)

コメント投稿

顔アイコン

顔アイコン・表示画像の選択

名前パスワードブログ
絵文字
×
  • オリジナル
  • SoftBank1
  • SoftBank2
  • SoftBank3
  • SoftBank4
  • docomo1
  • docomo2
  • au1
  • au2
  • au3
  • au4
投稿

.


プライバシー -  利用規約 -  メディアステートメント -  ガイドライン -  順守事項 -  ご意見・ご要望 -  ヘルプ・お問い合わせ

Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved.

みんなの更新記事