研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭

Slides:



Advertisements
Similar presentations
全脳アーキテクチャ解明ロー ドマップ 産業技術総合研究所 一杉裕志. 大脳皮質 モデル 大脳皮質モデルを中心とした ロードマップ xx 応用: パターン認識 ロボット制御単純労働様々な労働支援高度な言語処理 時間 到達 目標: 要素 技術: 皮質・基底核連携モデル.
Advertisements

コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
Learning Appearance in Virtual Scenarios for Pedestrian Detection
コンピュータ囲碁の仕組み ~ 将棋との違い ~
ラウンドトリップタイムを指標とした 無線LAN のためのアクセスポイント選択手法
ライフログデータとしての笑顔の蓄積システムの提案
学校教育と脳科学 討論 寺尾 敦 青山学院大学社会情報学部.
自律学習と動機づけ 教育心理学の観点から 2011/2/19 上淵 寿 (東京学芸大学).
AllReduce アルゴリズムによる QR 分解の精度について
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
Paper from PVLDB vol.7 (To appear in VLDB 2014)
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
TextonBoost:Joint Appearance, Shape and Context Modeling for Multi-Class Object Recognition and Segmentation 伊原有仁.
エージェントアプローチ 人工知能 21章 B4 片渕 聡.
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
研究背景 研究目的 手法 研究計画 分散型プラズマアクチュエータと物体形状の統合最適設計による 仮想空力形状の実現 jh NAH
Evidence-based Health Care とは何か
サポートベクターマシン によるパターン認識
高速CFDコードを用いた次世代空力応用研究プラットフォーム構築に 向けた実証研究
型付きアセンブリ言語を用いた安全なカーネル拡張
ソースコードの変更履歴における メトリクス値の変化を用いた ソフトウェアの特性分析
計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
電磁流体力学乱流の高精度・高並列LESシミュレーションコード開発研究
Vector 4 = [Vector 3, packet_size]
Authoring Environment for Story-based Digital Educational Games
アップデート 株式会社アプライド・マーケティング 大越 章司
放射光実験施設での散乱X線測定と EGS5シミュレーションとの比較
研究課題名 研究背景・目的 有機エレクトロニクス材料物質の基礎電子物性の理解 2. 理論 3. 計算方法、プログラムの現状
中京大学 工学部 電気電子工学科 白井研究室 4年 T 為房直人
情報検索技術に基づくベクトル表現と 深層学習を用いたコード片の類似性判定法
クラウドにおけるIntel SGXを用いた VMの安全な監視機構
三次元チェスアプリケーションの開発 およびUIの機能向上
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Data Clustering: A Review
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
数独の解生成と 解に対する番号付け 理学部 情報科学科 渡辺研究室 戸神星也.
可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
Nightmare at Test Time: Robust Learning by Feature Deletion
GW space-timeコードの大規模な有機-金属界面への適用に向けた高効率化
目的:高速QR分解ルーチンのGPUクラスタ実装
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
適応的近傍を持つ シミュレーテッドアニーリングの性能
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
Designing Robots in the Wild
法数学のための 機械学習の基礎 京大(医) 統計遺伝学分野 山田 亮 2017/04/15.
Data Clustering: A Review
Introduction to Soft Computing
自己組織化マップ Self-Organizing Map SOM
全体ミーティング (5/23) 村田雅之.
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
堆積炭塵爆発に対する大規模連成数値解析 研究背景 研究目的 計算対象および初期条件 燃焼波の様子(二次元解析) 今後の予定
ベイズ音声合成における 事前分布とモデル構造の話者間共有
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
イメージや意識通りの動きの習得 ~野球の打撃において~
クラスタリングを用いた ベイズ学習モデルを動的に更新する ソフトウェア障害検知手法
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
■ 背景 ■ 目的と作業内容 分子動力学法とフェーズフィールド法の融合による 粒成長の高精度解析法の構築 jh NAH
試行錯誤を重視した数学教育    群馬県立 吉井高等学校           大 塚 道 明.
第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日
背景 粒子法(SPH・MPSなど)は大規模流体シミュレーションなどで幅広く利用.一方で,手法の数学的正当化(数値解析)が不十分
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Jh ISJ 柏崎礼生 (大阪大学) 耐災害性・耐障害性の自己検証機能を具備した広域分散プラットフォームの国際的展開とHPCI-JHPCNシステム資源との柔軟な連携 目的 広域に分散した研究組織が計算機資源を提供し合うことにより構築される広域分散プラットフォームを拡大するとともに、運用にかかる人的負荷を軽減する仕組みとスモールスタートでこのプラットフォームに参画できる仕組みを作る。
アップデート.
転移学習 Transfer learning
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭 jh180067-DAJ 金子知適 (東京大学) 大規模な強化学習技術の実証と応用 研究背景と目的 一方で、 計算資源の肥大化 AlphaGo Zero の再現には 1700 年かかる 学習結果の信頼性の検証 なぜこの結果になるのか人間に説明 という課題 強化学習手法の台頭 DQN, A3C (Atari 2600) AlphaGo Zero (囲碁), Alpha Zero (将棋・チェス) 人間の知識なしで人間を超えた 囲碁将棋を主な対象に大規模強化学習の知見を蓄積 探索の効率化による学習の高速化 計算資源の削減 学習結果の可視化と説明 「なぜこの局面だとこの手が評価が高いのか」 出典: [1] 局面対による学習の高速化 2つの局面の優劣を学習することにより必要な学習局面 (i.e. 自己対戦回数) を削減 → Learning to Rank によって価値関数を学習   学習のデータ数を二乗のオーダーで増やせる 既存手法と比較して全体的に性能が向上 学習器の説明 学習したニューラルネットワークが「よく見ている」場所を可視化 Saliency Map を用いて最も注目している位置をハイライト 今後 探索部分の効率化を行い、学習を更に高速化 まだ良くわかっていない局面をより重視するような探索 探索を組み合わせた学習器の説明 References D. Silver et al, “Mastering the game of Go without human knowledge”, In: Nature 24270 O. David et al, “DeepChess: End-to-End Deep Neural Network for Automatic Learning in Chess”, In: ICANN 2016