計算機実験の計画 References 研究目的囲碁・将棋での強化学習高信頼性人工知能システムへの展望大規模な強化学習技術の実証と応用

計算機実験の計画 References 研究目的囲碁・将棋での強化学習高信頼性人工知能システムへの展望大規模な強化学習技術の実証と応用
jh DAH 金子知適（東京大学）大規模な強化学習技術の実証と応用構成員：金子知適（東京大学情報学環）、山口和紀（東京大学総合文化研究科）、他研究目的囲碁将棋を主な対象に大規模強化学習の知見を蓄積技術的課題に対する分析と新手法の開発計算資源の投入量と得られる性能向上の関係の最適化各計算ステップ（下図参照）の効率化囲碁・将棋での強化学習人の棋譜ゲーム木探索エージェント形勢評価関数 Value networks 初期値推定未来の(報酬)予測が正確な新世代作成教師データ局面と勝敗局面と未来の局面 (過去の世代と)大量に対局自己対局棋譜 e.g. 3000万局課題局面の抽出計算機実験の計画ジョブ分割と分散計算フレームワークの開発 1局1秒〜1時間程度の棋譜の生成と、学習による性能向上の評価各世代間の判断力向上と限界に関する評価高信頼性人工知能システムへの展望人の判断力を超えたシステムの性能の評価方法学習過程の可視化と判断の説明との連携人工知能システムの個性と常識の表現 References D. Silver et al. “Mastering the game of Go with deep neural networksand tree search”. In: Nature (Jan. 2016). Article, pp. 484–489. K. Hoki and T. Kaneko. “Large-Scale Optimization for Eval-uation Functions with Minimax Search”. In: J. Artif. Intell. Res. (JAIR)49 (2014), pp. 527–568.

計算機実験の計画 References 研究目的囲碁・将棋での強化学習高信頼性人工知能システムへの展望大規模な強化学習技術の実証と応用

Similar presentations

Presentation on theme: "計算機実験の計画 References 研究目的囲碁・将棋での強化学習高信頼性人工知能システムへの展望大規模な強化学習技術の実証と応用"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用

Similar presentations

Presentation on theme: "計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用"— Presentation transcript:

Similar presentations

About project

フィードバック

計算機実験の計画 References 研究目的囲碁・将棋での強化学習高信頼性人工知能システムへの展望大規模な強化学習技術の実証と応用

Presentation on theme: "計算機実験の計画 References 研究目的囲碁・将棋での強化学習高信頼性人工知能システムへの展望大規模な強化学習技術の実証と応用"— Presentation transcript: