計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用

Slides:



Advertisements
Similar presentations
全脳アーキテクチャ解明ロー ドマップ 産業技術総合研究所 一杉裕志. 大脳皮質 モデル 大脳皮質モデルを中心とした ロードマップ xx 応用: パターン認識 ロボット制御単純労働様々な労働支援高度な言語処理 時間 到達 目標: 要素 技術: 皮質・基底核連携モデル.
Advertisements

コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
07/11/211 7. 不確実性の処理 期待値、感度分析、情報の価値. 07/11/ 期待値分析 ( expected value ) 7.2 感度分析 ( sensitivity analysis ) 7.3 情報と準オプション価値 ( value of information )
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
ラベル付き区間グラフを列挙するBDDとその応用
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
補章 時系列モデル入門 ー 計量経済学 ー.
コンピュータ囲碁の仕組み ~ 将棋との違い ~
遺伝的アルゴリズム  新川 大貴.
人 工 知 能 第3回 探索法 (教科書21ページ~30ページ)
コンピュータリテラシ (1) 学習目標(到達目標) ・計算機実習室を正しく利用できる。 ・文書作成ソフトの利用方法を学び、報告作成が
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
MC-MPI (Multi-Cluster MPI)
整数計画法を用いた ペグソリティアの解法 ver. 2.1
エージェントアプローチ 人工知能 21章 B4 片渕 聡.
“いじめ現象”の形式構造を探る ~人工学級のMulti-Agent Simulation~
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
マイクロシミュレーションにおける 可変属性セル問題と解法
BML (Broadcast Markup Language)
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
補章 時系列モデル入門 ー 計量経済学 ー.
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
研究背景 研究目的 手法 研究計画 分散型プラズマアクチュエータと物体形状の統合最適設計による 仮想空力形状の実現 jh NAH
高速CFDコードを用いた次世代空力応用研究プラットフォーム構築に 向けた実証研究
協調機械システム論 ( ,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
領域分割手法について 2008年2月26日 中島研吾.
ソースコードの変更履歴における メトリクス値の変化を用いた ソフトウェアの特性分析
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
AMR法フレームワークの様々なアーキテクチャへ向けた発展 研究背景と研究目的 Xeon Phi対応に向けた拡張
モデルの適用範囲 モデルの適用領域 Applicability Domain (AD)
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
Vector 4 = [Vector 3, packet_size]
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
アップデート 株式会社アプライド・マーケティング 大越 章司
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
訓練データとテストデータが 異なる分布に従う場合の学習
研究課題名 研究背景・目的 有機エレクトロニクス材料物質の基礎電子物性の理解 2. 理論 3. 計算方法、プログラムの現状
中京大学 工学部 電気電子工学科 白井研究室 4年 T 為房直人
私の立場 OSカーネルを手がけるエンジニア 大阪市立大学 創造都市研究科の学生
瀬戸直樹 (京大理) 第7回スペース重力波アンテナDECIGOワークショップ 国立天文台
Data Clustering: A Review
可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化
部分的最小二乗回帰 Partial Least Squares Regression PLS
GW space-timeコードの大規模な有機-金属界面への適用に向けた高効率化
Python言語による ビジネスアナリティクス 実務家のための最適化・統計解析・機械学習 序文
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
端末・エッジ・クラウド連携の三位一体による 「考えるネットワーク」の研究
ベイズ最適化 Bayesian Optimization BO
Data Clustering: A Review
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
高精細計算を実現するAMR法フレームワークの高度化 研究背景と研究目的 複数GPU間での袖領域の交換と効率化
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日
Homogeneous model 相同モデル
実験計画法 Design of Experiments (DoE)
公開講演会 「コトバのミライ」 「世界は英語を選択するのか?」 嶋田 珠巳氏(明海大学教授)
社会情報学系 研究室ごとの履修モデル (履修推奨科目).
クライアントサイドから見えるサーバーサイド技術
慶應義塾大学 政策・メディア研究科 修士課程 2年 間 博人
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
大規模粒子法による大型クルーズ船の浸水解析
混合ガウスモデル Gaussian Mixture Model GMM
P2Pによる協調学習システム 唐澤 信介   北海道工業大学 電気工学専攻.
Presentation transcript:

計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用 jh170038-DAH 金子知適 (東京大学) 大規模な強化学習技術の実証と応用 構成員:金子知適(東京大学情報学環)、山口和紀(東京大学総合文化研究科) 、他 研究目的 囲碁将棋を主な対象に大規模強化学習の知見を蓄積 技術的課題に対する分析と新手法の開発 計算資源の投入量と得られる性能向上の関係の最適化 各計算ステップ(下図参照)の効率化 囲碁・将棋での強化学習 人の棋譜 ゲーム木探索エージェント 形勢評価関数 Value networks 初期値推定 未来の(報酬)予測が 正確な新世代作成 教師データ 局面と勝敗 局面と未来の局面 (過去の世代と)大量に対局 自己対局棋譜 e.g. 3000万局 課題局面の抽出 計算機実験の計画 ジョブ分割と分散計算フレームワークの開発 1局1秒〜1時間程度の棋譜の生成と、学習による性能向上の評価 各世代間の判断力向上と限界に関する評価 高信頼性人工知能システムへの展望 人の判断力を超えたシステムの性能の評価方法 学習過程の可視化と判断の説明との連携 人工知能システムの個性と常識の表現 References D. Silver et al. “Mastering the game of Go with deep neural networksand tree search”. In: Nature 529.7587 (Jan. 2016). Article, pp. 484–489. K. Hoki and T. Kaneko. “Large-Scale Optimization for Eval-uation Functions with Minimax Search”. In: J. Artif. Intell. Res. (JAIR)49 (2014), pp. 527–568.