|
テーマ:将棋について(1324)
カテゴリ:将棋
第3回電王戦用Ponanza提出
>先ほどドワンゴ様の方に第3回電王戦出場用Ponanzaを提出しました。 >評価関数などに乱数を加えた実装です。 >純粋なPonanza vs. 乱数を加えたPonanzaの試合結果は522-430 >乱数を加えたPonanzaがわずかに弱くなっていますが、対人戦で研究にはまらないために仕方のない経費という認識です。 今回の電王戦では事前に対戦ソフトを棋士側に提出することになっている。 ということは、本戦までの4〜5ヶ月の間、徹底的にソフトの癖を解析される。 「こう指せば必ずこう指してくる」みたいな癖を。 そこでPonanzaとしては指し手に乱数を導入し、癖を減らす対策をしたわけだ。 つまり全ての指し手で最善手を求めるのでないということ。 ゲームの本質を探究するより、対人での勝利を優先ということね。 ソフトの棋力向上やゲームの解明という本質から外れているけど、今回は仕方ないだろう。 それに市販ソフトの場合、遊ぶ人が「ソフトは同じ局面で同じ手ばかり指してくる」 という不満もありえるので、その辺の技術が向上するというメリットはなくはないかも。 Ponanzaは市販ソフトじゃないけど。 この最善手より次善手を選ぶというのは、大山十五世名人的でもある。 大山名人は「一回目のチャンスは見送る」等、必ずしも最善手を求めていなかったという。 大山名人の「最善手を指さない」は相手の読みを外し疲れさせることが目的だという。 将棋では「こちらがAと指せば相手はBと返してくるだろうから、そこでCと指そう」と考える。 これを一時間考えたとしよう。 しかしそこで相手がBではなくDを返してきたらCの読みは無駄になり、 一時間の思考は無意味だったことになる。 また一から読み直しだ。 こんなことが何度も繰り返されれば、読み疲れしてしまう。 もちろんその局面ではBが最善手つまり最高の手かもしれない。 しかし100手以上も続く将棋で毎回毎回最善手は指せないし、いつかはミスをする。 自分で大ミスするより、相手の大ミスを誘う次善手が有効な場合もある。 そんな考えの下、大山名人は敢えて次善手のDを指したらしい。 また最善手は対戦前に事前研究されるが、次善手は事前研究される可能性は低い。 対戦前とはいえ時間には限度がある。 100点の手は研究しても、無駄になるであろう70点の手は研究しないいものだ。 この様に、時と場合によっては最善手より次善手を選ぶのは必ずしも悪い方法論ではない。 但し、それはミスを避けられない人間同士の対戦で有効なこと。 今回はこの方法をソフトが人間相手にするというのが皮肉だ(笑)。 計算能力が高く最善手を見つけることを至上価値とするソフトが、 目的を忘れて相手を疲れさせる指し手を選ぶ。 なんとも皮肉な行動と言えるだろう。 本戦において人間がそれをどう感じるのか、非常に興味深い。 本戦での結果以上に楽しみだ。 お気に入りの記事を「いいね!」で応援しよう
最終更新日
2013.11.14 23:30:03
コメント(0) | コメントを書く
[将棋] カテゴリの最新記事
|