将棋名人のレーティングと棋譜分析 山下 宏 2014年11月7日 GPW 箱根.

Slides:



Advertisements
Similar presentations
コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
Advertisements

数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
平成 20 年 8 月 23 日平成 20 年度 県立広島大学公開講座 1 表計算ソフトを使って 万年カレンダーを作ろう! 県立広島大学 経営情報学部 経営情報学科 小川仁士.
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
リーダー 辻元健照 プログラム 北川泰士 アルゴリズム 水野雄太 ユーザー 松田邦久 プレゼン 戸所風士
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
極小集合被覆を列挙する 実用的高速アルゴリズム
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
コンピュータ囲碁の仕組み ~ 将棋との違い ~
実証分析の手順 経済データ解析 2011年度.
Pattern Recognition and Machine Learning 1.5 決定理論
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
将棋プログラム「激指」  鶴岡 慶雅.
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
ユースケース図 FM12012 比嘉久登.
第2回電王戦 プロ棋士とコンピュータによる対局 2013年3月23日〜4月20日 5週 持ち時間4時間 ニコニコ生放送で生中継
Bias2 - Variance - Noise 分解
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
日経平均株価の時系列データ分析 B03007 明田 剛慈.
15パズルの解法について 北海道情報大学 情報メディア学部 情報メディア学科 新井山ゼミ  大石 貴弘.
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
ランダムウォークに関するいくつかの話題 ・ランダムウォークの破産問題 ・ランダムウォークの鏡像原理 1 小暮研究会Ⅰ 11月12日
モンテカルロ法と囲碁・将棋ソフトの人知超え
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
離婚が出生数に与える影響 -都道府県データを用いた計量分析
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
7-3.高度な木 (平衡木) AVL木 平衡2分木。回転操作に基づくバランス回復機構により平衡を保つ。 B木
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
二人零和不完全情報ゲームであるジャンケンにおけるゲームの洗練法
WWW上の効率的な ハブ探索法の提案と実装
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
近畿大学理工学部情報学科 情報論理工学研究室 赤井 隆純
プログラミングコンテストシステムへの 提出履歴データとその分析
所属集団の変更できる社会的ジレンマ実験について2
部分的最小二乗回帰 Partial Least Squares Regression PLS
モンテカルロ法を用いた 立体四目並べの対戦プログラム
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
資料: 報道発表資料 気象庁マグニチュード算出方法の改訂について。
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
1:Weak lensing 2:shear 3:高次展開 4:利点 5:問題点
統計学  第9回 西 山.
構造的類似性を持つ半構造化文書における頻度分析
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
or-8. ゲーム理論 (オペレーションズリサーチを Excel で実習するシリーズ)
数理統計学  第6回 西山.
第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日
議論の前提 ある人獣共通感染症は、野生動物が感染源となって直接又は媒介動物を通じて人に感染を起こす。
回帰分析入門 経済データ解析 2011年度.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
Presentation transcript:

将棋名人のレーティングと棋譜分析 山下 宏 2014年11月7日 GPW 箱根

大山15世名人と羽生名人、 全盛期に戦えばどちらが強い? 大山康晴15世名人 タイトル獲得80期 昭和の覇者 羽生善治名人 1996年に7冠達成 平成の覇者

歴代名人の強さを調べる 対局の結果から 棋譜の内容から 対局者の棋力を点数で表す 勝てば点数プラス、負ければマイナス いわゆるEloレーティング 棋譜の内容から 棋譜を将棋プログラムで解析して強さを推定 勝敗の情報は使わない こちらがメインです

棋譜 棋譜でーたーべーす 将棋倶楽部24の24万局集 ネットでの匿名による棋譜の登録 56,000局 プロがメインだがアマや女流も含む 重複や入力ミスがある 日付が同じ棋譜だけは修正 将棋倶楽部24の24万局集 対局サイトの棋譜からアマの棋譜を24万局 2004年出版。今は絶版。

対局の結果からのレーティング Eloレーティング 対局者の強さを点数で表す 100点差で勝率64%、200点差で75%になる 同じ点数同士。勝者+16点、敗者ー16点 200点差。強い方が勝ち 勝者+8点、敗者ー8点 200点差。弱い方が勝ち 勝者+24点、敗者ー24点 3勝1敗ペース(75%)で点数の変動なし

実際は理論勝率からずれるらしい チェスの場合 白番の勝率が 互角で54%近い The Sonas Rating Formulaから引用

将棋倶楽部24のレーティング差と勝率 ±50で95%を占めるのでレート差があるときのデータ不足

Eloの計算式

Eloレーティングの特徴 点数の差のみに意味がある 点数の大きさに意味はない 計算が簡単 全員に+500点、など任意の数字を足せる 将棋倶楽部24はEloの簡易版を利用

プロ棋士のEloレーティングを計算 全員の初期値を1500点で計算 清水市代さんが1578点に 高すぎる! 男性に163局で勝率0.18 女流に523局で勝率0.65 女流を除くと1286点まで下がる 女流を含めた計算で清水さんが1286点になるように女流の初期値を1074点にした

Eloレーティングの弱点 母集団が異なり、相互の対局数が少ないときは苦手

歴代名人のEloレーティングの推移

「棋譜でーたべーす」の年毎の棋譜数 大山の1960年代は棋譜数が250程度と少ない。 弱い棋士の棋譜がないためEloの上昇が小さくなっていると思われる。

現役プロ棋士の人数の推移 現在は160人。1960年代も70人でそれほど少ないわけではない。

Whole-History Rating (WHR) Eloが1局のみの結果で更新するのに対し、WHRはすべての対局結果から最大事後確率を計算する レーティングの高い方が勝つ、という予想が Elo 55.1% 当たる WHR 55.8% 当たる わずかだがWHRの方が予測性能がいい

WHRの計算例 1 例えば下記の結果があった場合 3人のプレイヤ(A、B、C) がいて 1日目 A が B に勝つ 3日目 C が A に勝つ

WHRの計算例 2 1日目(AがBに勝つ)で計算 A B C 1日目 +92 -92 ---

WHRの計算例 3 2日目(AがBにまた勝つ)までで計算 A B C 1日目 +131 -131 --- 2日目 +132 -132 ---

WHRの計算例 4 3日目(CがAに勝つ)までで計算 A B C 1日目 +35 -174 --- 2日目 +35 -174 --- 1日目 +35 -174 --- 2日目 +35 -174 --- 3日目 +34 -174 +132 3日目は対局していない B の点も下がり、同時に A, B の過去の点も変化する

Elo WHR

棋譜の内容からレーティングを計算 Bonanza6.0を使って棋譜の1手1手を探索 探索深さは11に固定 最善手と評価値を記録 探索深さは11に固定 詰をBonanzaのdfpn、1000万ノードで調べる

棋力との関連性が高い指標を見つけたい 「平均悪手」という指標を導入する Bonanzaと違う手を指して、かつ評価が下がったときを悪手とする

平均悪手の計算例 ▲7六歩をBonanzaは選び評価は +0.3 人間は▲2六歩を指した 評価が下がっているので悪手と認定 次の▲2六歩の局面の評価は +0.2 評価が下がっているので悪手と認定 「悪手合計」 += 0.1 「平均悪手」 = 「悪手合計」 ÷ 「手数」

平均悪手で無視する手 40手目以降のみを対象 +10以上の評価は無視 定跡の排除 「形作り」の手を排除 詰みが絡む局面が必要以上に影響するのを避ける

同様に 「平均好手」 「一致率」 「好手率」 Bonanzaと違う手を指して評価が上がった場合 Bonanzaと同じ手を指した割合 好手を指した割合

「複雑さ」 局面の複雑さを表す指標 反復深化の途中で最善手が変わった場合の評価値の差の合計 「平均変動」という名称が正しいかも 深さ1 ▲76歩 +0.3 深さ2 ▲26歩 +0.2 深さ3 ▲26歩 +0.0 深さ 1 → 2 のみが対象で、複雑さは 0.1 「平均変動」という名称が正しいかも

「複雑さ」と「平均悪手」の関係 複雑になるほど悪手も増加

将棋倶楽部24の棋譜を解析 R300、R800、R1300、R1800、R2300、R2400、R2500、R2600、R2700 の棋譜を200局ずつ調べた R300の棋譜は R350 ±30 同士の対戦 Bonanzaの深さは11だけでなく、 深さ2、深さ6も調べた

将棋倶楽部24のレーティング分布

深さ2、6、11での平均悪手

深さ11での平均好手

深さ2、6、11での好手率

深さ2、6、11での複雑さ

深さ2、6、11での一致率

詰見逃し率(100局あたりの回数)

平均悪手がもっとも予測できそう 深さ11の平均悪手に直線を当てはめる Rating = -3148 × 平均悪手 + 4620 が成り立つとする

解析に使ったBonanzaの強さ

floodgateと将棋倶楽部24のレーティングを直接比較できるとする 2004年の将棋倶楽部24との比較 将棋倶楽部24は年々インフレしている? floodgateは2007年の将棋倶楽部24の YSSの点数と一致するように調整された ちょっと乱暴だがそれほど差はないはず

深さ2、6、11での平均悪手(再掲) 深さ6でR2700まで分類できている。 深さ6の強さはR2009 700点上まで予測可能か?

深さ3、4、5での平均悪手 深さ5でもR2700まで分類できている。 深さ5の強さはR1830。900点上まで予測可能か?

この手法の欠陥 プログラムより強い棋譜は分類できないはず プログラム自身の棋譜を解析すれば平均悪手は0になってしまう 深さ2(R1200)でもR1800まで分類できている? 自分より強い棋譜も分類可能か プログラム自身の棋譜を解析すれば平均悪手は0になってしまう 明らかに正しくない! しかし人間の棋譜に関しては強い関連性があるように思われる

GPSFishでも同様の解析を行った GPSFish(2013年8月版)の深さ12固定 Bonanzaの深さ11に319勝181敗 Bonanzaより1手深いが時間は1局8分と6分でGPSFishの方が短い Bonanzaの深さ11に319勝181敗 レーティングだと+99強い より正確な解析ができると期待

深さ2、7、12の平均悪手(GPSFish)

深さ3、4、5、6の平均悪手(GPSFish) 縦方向に拡大している。 深さ4で R2700 まで 分類できている?

4人の名人のタイトル戦でのレーティング推移 タイトル戦の平均悪手をレーティングに換算 タイトル戦に限定したのはトップレベルの強さを発揮していた時期を比較したかったため 以下の4人 大山康晴 15世名人 中原誠 16世名人 谷川浩司 17世名人 羽生善治 19世名人

大山の換算レーティングの推移 年平均16局 R3000前後で推移

中原の換算レーティングの推移 年平均18局 R3100前後で推移

谷川の換算レーティングの推移 年平均12局 R3100? ばらつきが大きい

羽生の換算レーティングの推移 年平均22局 R3300前後で推移

羽生の点数が大山を上回る 羽生の1996年、大山の1964年、その前後2年の平均では羽生が227点上

GPSFishの方が変動が小さい

加藤一二三のWHRレーティングと換算レーティングを比較する 棋譜は早指し戦を除く1455棋譜 タイトル戦以外も含む BonanzaとGPSFishの平均を取る さらにその3年間の移動平均とWHRを比較

加藤のWHRと換算レーティング

勝敗の結果のみから計算したレーティングと棋譜の内容のみからら計算したレーティングがほぼ一致した

江戸時代の棋士の結果

家元制最強は宗英、を確認? 六代大橋宗英の換算Rが高い 『宗英は家元制で最強の名人とされる』 関西将棋連盟のホームページより

タイトル戦(2日制)を基準とした 1日制、NHK杯の差 NHK杯の棋譜は両対局者のEloレーティングの合計が高いものから年間上位10局 タイトル戦と同レベルの棋士が指した棋譜を集めた

2日制と1日制には明確に差がある 2日制に比べて 加藤一二三はNHK杯で91点低い、と小さい 1日制は 100点低い 1日制は 100点低い NHK杯は 200点低い BonanzaとGPSFishの平均で 加藤一二三はNHK杯で91点低い、と小さい 「秒読みの神様」を確認?

ソフトの換算レーティング Floodgateの棋譜から 全般に換算Rが高すぎる 15分のNDFより6時間のgpsfish_Xeonが強いはずだが分かってない 詰見逃しはソフトには無関係らしい ソフトの換算Rは信用できない?

NHK杯の羽生とdcsyhi(デクシ)の比較 dcsyhiは羽生ではなかった? 400点差もある dcsyhiの棋譜は羽生にしては弱すぎる もしくはNHK杯の10分+30秒+考慮時間1分×10回と将棋倶楽部24の1分+30秒の差か?

以降はやや否定的なデータです

アマチュアの人の換算Rを計算 将棋倶楽部24の人達のレーティングを検証 1300点(1350±30)で対局した棋譜を解析 名前の後ろは平均レーティング 1300点(1350±30)で対局した棋譜を解析 1800点(1850±30) 2300点(2350±30) 対局日は関係なくランダムに並び替え 論文含め、換算Rは+50を足すのが正しい

1300点の人達の換算R

1300点の人達の換算R その2

1800点の人達の換算R

2300点の人達の換算R

2600点の人達の換算R

かなりブレが大きい 棋風によって500点程度はずれる? 持ち時間の差が大きい?(棋譜に情報なし) 対局数は24局程度は必要か? Rが高いほどぶれは減っている 持ち時間の差が大きい?(棋譜に情報なし) 早指し ・・・ 1分+1手30秒 15分 ・・・ 15分+1手1分 R1300は7割が早指し R1800は9割が早指し 対局数は24局程度は必要か?

勝又さんの換算レーティング推移 年平均11局 平均換算R3042

勝又さんの換算レーティング WHRはほとんど動きがない 換算Rの平均は3042 WHRの平均はR2952で90点差 加藤一二三さんと同じだけ並行移動した場合 女流を含めた平均はR2837(1438+1399) 換算Rはタイトル戦の中原16世名人に近い

神様のレーティングはR4600? Bonanza GPSFish 平均悪手 y=0 で 4620 と 4743 rating = -3148y + 4620 GPSFish rating = -2560y + 4743 平均悪手 y=0 で 4620 と 4743 このあたりが神様のレーティングか?

仮定に仮定を重ねた結果ですが 羽生の7冠時代は大山の全盛期より227点強い 20棋譜程度ですべてのプレイヤの棋力を推定できる 大橋宗英が家元制で最強なのを確認した 2日制の棋譜は1日制、NHK杯よりはっきりレベルが高い

今後の課題 より予測が正確な指標の発見 より正確で、多くの棋譜の入手 将棋倶楽部24のレーティングが正しいか検証 より深い探索での解析 平均悪手と好手率、複雑さの組み合わせなど より正確で、多くの棋譜の入手 将棋倶楽部24のレーティングが正しいか検証 R2700以上が増えるなどインフレしている? 持ち時間を統一して調べる より深い探索での解析 より多くのプログラムでの解析