RoboCupサッカーシミュレーションにおける今後の研究課題 秋山英久

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

RoboCupサッカーシミュレーションにおける今後の研究課題 秋山英久

サッカーシミュレーションリーグ(2D) の歴史

RoboCup97 開催地 : 名古屋 優勝 : AT-Humboldt

〜1997 どのチームもまだプログラムを作り込めてい ない シミュレータのパラメータ調整が不十分 そもそも,サッカーのルールの実装も不十分 その代わり,研究志向の強いチームは多かっ た 強化学習によるポジション獲得 GPによる行動ルール獲得 ...

開催地 : パリ (フランス) 優勝 : CMUnited (アメリカ ) RoboCup98 キーパ導入 オフサイド導入 sserver-4.x キーパ導入 オフサイド導入

開催地 : ストックホルム ( スウェーデン) 優勝 :CMUnited (アメリカ ) RoboCup99 sserver-5.x プレイヤのサイズ縮小 首の角度導入 オンラインコーチ導入

〜1999 Peter Stoneによる連覇 Layered Learning Layered ディスクロージャ ビジュアルデバッガの走り Locker Room Agreement 結局は,個体の能力が全ての時代

優勝 : FCPortugal(ポルト ガル) RoboCup2000 開催地 : メルボルン (オー ストラリア) 優勝 : FCPortugal(ポルト ガル) sserver-6.x 秋山,ATeamで初参加 3敗で終了 概ねCMUnitedベース

〜2000 FCPortugalが初出場初優勝 現在主流のフォーメーションシステム (SBSP)が完成 チームワークをパラメータで表現 ポジションチェンジ(DPRE)の実現 コミュニケーションの最大活用 キック列の探索を最適化問題として捉え, ランダム探索+山登り法で解決 ビジュアルデバッガ Brainstormers 強化学習によるスキル獲得 Brainstormersがベースコードを公開

開催地 : シアトル (USA) 優勝 : TsinguAeolus(中国 ) RoboCup2001 sserver-7.x プレイヤのキック能力向上,へテロプレ イヤの導入 コーチ言語(CLang)導入 秋山,ATeamで参加 二次予選敗退 一部CMUnitedベース + いくつかの独自 コード投入

〜2001 TsinguAeolusが初出場初優勝 再び,個人能力の時代 (当時としては)驚異的なドリブル能力 強力な足回り UvA Trilearnがベースコードを公開

開催地 : 福岡 優勝 : TsinguAeolus(中国) RoboCup2002 秋山,HELIOSで参加 ベスト8 ほぼ独自開発 rcssserver-8.x 秋山,HELIOSで参加 ベスト8 ほぼ独自開発 Soccer Viewer を使用開始

〜2002 TsinguAeolus2001が公開したソースを使用したチ ームが大量発生 TsinguAeolusのコピーチームが準優勝 UvA Trilearnがベースコードを公開

優勝 : UvA Trilearn(オラン ダ) RoboCup2003 開催地 : パドヴァ(イタリア ) 優勝 : UvA Trilearn(オラン ダ) rcssserver-9.x 競技の自動実行開始 秋山,HELIOSで参加 ベスト8 完全に作り直し.ほぼ現在のlibrcscの形 に

〜2003 トータルバランスに優れたUvA Trilearnが優勝 優勝チームでも失点するようになった. 以降,UvA Baseとして多くのチームが利用 パーティクルフィルタによる位置測定 現在では,Brainstormersなども導入 精度は良いが,かなりCPUを食う

開催地 : リスボン(ポルトガ ル) 優勝 : STEP(ロシア) RoboCup2004 秋山,TokyoTechSFCで参加 3Dリーグ開始 秋山,TokyoTechSFCで参加 予選免除,二次予選敗退 へテロを使いはじめた以外,特に進歩無 し

〜2004 三度,個人能力の時代 ドリブル突破技術の向上 STEP,UvA,RoboSina などが驚異的なドリブ ル突破能力を見せる 論文化された情報は特に無し. 恐らく,オンライン探索を行っている

優勝 : Brainstormers(ドイ ツ) RoboCup2005 開催地 : 大阪 優勝 : Brainstormers(ドイ ツ) rcssserver-10.x 秋山,TokyoTechSFCで参加 予選1位通過, 3位 フォーメーションシステムの刷新.中盤 の支配率向上 soccerwindow2の使用開始

〜2005 本格的なスルーパス(WrightEagle)の登場 パスが出る前から走り込み 動的ポジショニング(Brainstormers)の登場 固定的なフォーメーションを持たない,完全なマ ンツーマンディフェンス Brainstormersがベースコードを公開

開催地 : ブレーメン(ドイツ ) 優勝 : WrightEagle(中国) RoboCup2006 秋山,TokyoTechSFCで参加 予選免除, 4位 フォーメーションシステムを改良するも ,他は特に進歩無し 全ソースコードをリリース

〜2006 WrightEagle2005の影響により,全体的に中盤での守 備が向上 個体の基本スキルはほぼ頭打ち 〜2006  WrightEagle2005の影響により,全体的に中盤での守 備が向上 個体の基本スキルはほぼ頭打ち しかし,戦略的な進歩は停滞気味 恐らく,ほとんどのチームが守備に注力していた ため

2007〜  より人間の現代サッカーに近付いて,動 的なポジショニングを行えるかどうかが 重要になるのではと予想

チーム開発における課題

ワールドモデルの再構成 プレイヤのマッチング ゴーストオブジェクトの検出 コミュニケーションによる更新 認識精度の向上は極めて重要であるはず なのに,何故かあまり研究対象になって いない

サッカープレイヤとしての基本スキル インターセプト(ボール捕捉) キック パス,シュート探索 マーク ...

インターセプト もっとも重要なスキル ボールの軌道,及び,自分を含めた全プ レイヤの位置の予測 高速計算するアルゴリズムが必要 ノイズ処理 戦略的に有利な位置でトラップ(スマー トインターセプト)するためのプランニ ングが必要

スマートインターセプト 主に二つの目的 ターン回数を減らし,先回りすること で,ミスを減らす 攻撃的プレイヤがより前方でトラップ 戦術的に有利なトラップ位置を求めるこ とはかなり難しい

敵に妨害されるかも知れないが,あえて トラップ動作を遅れさせた方が良い場合 も 有利なトラップ位置を求めるには 敵に妨害されない範囲の予測 敵に妨害されるかも知れないが,あえて トラップ動作を遅れさせた方が良い場合 も 普通に学習させようとしても獲得できない そもそも,敵の妨害範囲を予測すること 自体が難しい 厳密に予測しようとすると,選択肢が無く なる

キック ボールに必要な速度を与えるために,複 数回の連続したキックが要求される 適切なキック列の動的な探索が必要 敵の妨害を回避するための予測が必要

キック列の例

キック列の例(敵の回避)

TsinguAeolusの方法がほぼベスト Q学習によるヒューリスティック獲得 オンラインでのA*探索 キック列の探索アルゴリズム TsinguAeolusの方法がほぼベスト Q学習によるヒューリスティック獲得 オンラインでのA*探索 資料の準備が間に合わなかったので説明は割 愛 librcscでは割と単純な再帰的探索 敵による妨害範囲の予測が必要

ドリブル 局面の打開のために必要なスキル 敵の妨害を回避するためのプランニング 最近は,ゴール前で密集するディフェンダ を回避できるかいなかが得点能力に直結 動的な探索が必要 へテロプレイヤへの対応 スムーズな移動 敵の妨害を回避するためのプランニング

最近は,複数のパターンを予測して,も っとも遠くへ辿り着けるキックを探索す る手法が主流 ドリブルの探索 最近は,複数のパターンを予測して,も っとも遠くへ辿り着けるキックを探索す る手法が主流 Branstormers05のベースソースなど CPUは消費するが,確実 回避の判断に改良の余地が大いに有り 回避動作が必要かいなか どの方向に回避するか 敵による妨害範囲の予測が必要

探索時に観測されていなかったプレイヤ の予測が困難 パス,シュートの探索 基本的に, 複数のボール初速度のパターンを生成し, ある初速度のボールに対して,敵の方が味 方よりも早く到達するかどうかを, 可能なかぎり厳密に計算しなければならな い 計算量が膨大 Newton法による高速計算 探索時に観測されていなかったプレイヤ の予測が困難

特定のチームやプレイヤの癖を検出でき れば更に有利 意思決定の全てに関わる重要な情報のは ずなのに,ほとんど研究されていない 敵の行動範囲の予測 良くある対処 妨害動作をしそうなプレイヤへの注目 コミュニケーションによる情報共有 最後に観測した位置から移動範囲を予測 特定のチームやプレイヤの癖を検出でき れば更に有利 意思決定の全てに関わる重要な情報のは ずなのに,ほとんど研究されていない

プレイヤの意図の予測 パスの誘発 行動のサポート レシーバ側の動きをパサーが察知でき スタミナ切れで動けない味方とのポジショ ン チェンジ,など 敵プレイヤのマーク 対象プレイヤがどこに向かおうとしている のか,など

その他の課題

良いものができれば,論文でも参照され まくっておいしいはず 評価方法 標準と言える評価基準が存在しない ツールはいくつか存在するが,基準はまっ たく統一されていない 実際のサッカーにも定量的な評価指標があ るのだから,できるはず 行動の識別ルールが存在しない パスの定義,ドリブルの定義…などなど 良いものができれば,論文でも参照され まくっておいしいはず なので,誰かやりませんか?

開発用リソース ライブラリ開発サイト 配布サイト http://svn.nue.ci.i.u-tokyo.ac.jp/trac/rctools/ 配布サイト http://sourceforge.jp/projects/rctools/

最近やっていること Delaunay三角分割を利用した フォーメーション獲得

問題設定 入力 : 注目点の座標(x,y) 出力 : プレイヤが移動すべき位置座標(x,y) × N 今のところ,多次元入出力を扱わない.3 次元への拡張は,恐らく問題無く可能

適用方法 2入力,2出力の関数近似器を用意 関数近似器はエージェントごとに独立に獲 得 関数近似器は全エージェントでまとめて管 理,ユーザからは,2入力,2 x N出力の関 数に見える. 人間が教師データを作成 GUIの専用ツールを使用 現在,ふたつの手法を実装済み ニューラルネットによる関数近似 Delaunay三角分割+線形補間

GUIの教示ツール

ニューラルネットによる関数近似 非常に一般的なフィードフォワード型の3層 ニューラルネットワークを使用 入力層ユニット数: 2 中間層ユニット数: 10 (シグモイド関数) 出力層ユニット数: 2 (シグモイド関数 )

利点と欠点 利点 実装が容易な割りにそこそこ上手く動く 欠点 学習パラメータの手動調整が必要 学習率,中間層のユニット数,など 細かい修正が効かない.思いどおりに動か せない. 過学習 ひとつの訓練データが全体へ影響 サンプルの間隔に結果の精度が大きく影 響される.サンプルを与えすぎてもダメ

三角分割を利用した関数近似 領域の三角形分割と線形補間を組合せ,離散 的なサンプルから近似関数を得る方法を提案 . 領域の分割法として,Delaunay三角分割を 使用 補間法として,3DCGのシェーディングアル ゴリズムを使用

三角分割の例 赤点と赤線がDelaunay三角分割 破線がVoronoi図

線形補間の手順 ボールを含む三角形を探す 三角形の各頂点が保持する,プレイヤの移動 目標位置座標を得る. それら3出力を,3頂点からの距離に応じた線 形補間で合成する.

線形補間の手法 グローシェーディングアルゴリズム 3DCGにおける陰影付け手法の一つ Icを求める 𝐼 𝑎 = 𝐼 1  𝐼 2 − 𝐼 1  𝑦 𝑎 − 𝑦 1 𝑦 2 − 𝑦 1 𝐼 𝑏 = 𝐼 1  𝐼 3 − 𝐼 1  𝑦 𝑏 − 𝑦 1 𝑦 3 − 𝑦 1 𝐼 𝑐 = 𝐼 𝑎  𝐼 𝑏 − 𝐼 𝑎  𝑥 𝑐 − 𝑥 𝑎 𝑥 𝑏 − 𝑥 𝑎

特徴 k-NN法とは異なり,必ずしも最近傍のサンプ ルが選ばれるわけでは無い. 現在の注目点を含む三角形の3頂点しか考 慮されない. 個々のサンプルの独立性が非常に高くなり ,局所的な変更が極めて容易 概念的には,基底関数による関数近似に近い 人間が見ても理解できる 逐次追加が可能

利点と欠点 利点 学習にかかるコストは,三角分割にかかる 計算だけ. 100%の再現性.教師データが確実に反映さ れる. 任意の対象領域に対応可能 人間が容易に介在可能 欠点 ボールと移動目標位置 との対応が一意に定 まっている教師データが必要. 複雑な非線型関数を精度良く近似しようと すると,必要な三角形の数が膨大になる.

現在,取り組み中 フォーメーションの自動獲得 チーム戦術との融合

サーバとの通信と同期 純粋にソフトウェア開発の問題 rcssserverの仕様や環境に合わせたチューニン グが必要 librcscで実装済み

メッセージ解析 純粋にソフトウェア開発の問題 S式パーザが必要 librcscで実装済み flex/bisonで作り直したい (see 187 ((g r) 49.4 8) ((f g r b) 50.4 16) ((f g r t) 49.9 0) ((f p r c) 33.1 8) ((f r 0) 54.6 8) ((f r t 10) 55.1 -3) ((f r t 20) 58 -13) ((f r t 30) 61.6 -21) ((f r b 10) 55.7 18) ((b) 40.4 2) ((p "HELIOS" 10) 24.5 5 0 -0.1 0 –39 t) ((p "YowAI2002") 40.4 2) ((p "YowAI2002" 3) 30 18 0 -0.1 5 -85) ((p "YowAI2002") 30 -6) ((p "YowAI2002" 6) 18.2 3 0 0 11 0) ((P) 2 130) ((l r) 49.9 -83))

位置測定 世界的にはUvAのパーティクルフィルタが有 YowAIのテーブル方式が高速でお薦め