ITSにおける知的ネットワークシステムの構築 - 知的信号機システムの提案 -

Slides:

Advertisements

Similar presentations

静岡大学情報学研究科戸根木千洋ユーザーイメージ収集インターフェースの開発. 2 目次背景と目的研究の構成研究の詳細イメージ収集インターフェースの提案映画イメージ収集システムの開発システムの評価今後の課題.

Advertisements

HBSP モデル上での行列積を求めるアルゴリム情報論理工学吉岡健太.

三木光範（同志社大学工学部）廣安知之（同志社大学工学部）花田良子（同志社大学工学部学部生）水田伯典（同志社大学大学院）ジョブショップスケジューリング問題への分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.

ユーザーイメージ収集インターフェイスの開発

Web アプリをユーザー毎にカスタマイズ可能にする AOP フレームワーク

遺伝的アルゴリズムにおけるランドスケープによる問題のクラス分類

MPIを用いたグラフの並列計算情報論理工学研究室藤本　涼一.

3次元nクイーン問題の解に関する研究論理工学研究室伊藤精一

グローバルコンピューティング環境における遺伝的アルゴリズムの検討

Actor-Criticを用いた知的ネットワークシステムの提案

最新ファイルの提供を保証する代理FTPサーバの開発

点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上

視線に基づくサブゴールを用いた歩行者の行動モデル

知的ネットワークシステムへの強化学習の適用

ここに若林の絵が入る Ⅰ 従来型サービスの課題 Ⅴ Solaris基盤ヘルスチェックサービス ●従来型サービス Ⅱ 新サービスの概要

ラウンドトリップタイムを指標とした無線LAN のためのアクセスポイント選択手法

府中都市計画道路３・３・８号府中所沢線整備事業

ＰＣクラスタにおける２個体分散遺伝的アルゴリズムの高速化

神奈川大学大学院工学研究科電気電子情報工学専攻

シミュレーション論 Ⅱ 第１２回強化学習.

P,Q比が変更可能なScaLAPACKのコスト見積もり関数の開発

ネットワークの基礎技術.

先端論文紹介ゼミ Role-based Context-specific Multiagent Q-learning

エージェントアプローチ人工知能　21章 B4　片渕聡.

制約条件の確率的選択に基づく資源追加削減法の改良三木光範（同志社大工）廣安知之（同志社大工） ○小林繁（同志社大院）

Towards Commercial Mobile Ad Hoc Network Applications: A Radio Dispatch System ECN M1 sada.

【会議の進め方】会議の定義：問題を解決する場であり情報を共有する場ではない作成：増永寛之

交通量観測地点を考慮した時間OD推定モデルの開発と大規模ネットワークへの適用

ＩＴＳ（高度道路交通システム）とは何か？

画像情報を用いた交通流計測情報工学科藤吉研究室 EP02076 都築勇司

３次元剛体運動の理論とシミュレーション技法

MPIによる行列積計算情報論理工学研究室渡邉伊織情報論理工学研究室渡邉伊織です。

大気レーダーのアダプティブクラッタ抑圧法の開発

シミュレーション論 Ⅱ 第１２回様々なシミュレーション手法（３）　強化学習.

KECSフォーラム Intelligent Systems --

協調機械システム論 ( ，本郷）協調機械システム論東京大学　人工物工学研究センター淺間　一.

MPIを用いた最適な分散処理情報論理工学研究室角仁志

ベイジアンネット混合モデルによる強化学習エージェントの方策改善

1DS05175M 安東遼一 1DS05213M 渡邉光寿指導教員：高木先生

アップデート株式会社アプライド・マーケティング大越　章司

第14章　モデルの結合修士２年山川佳洋.

TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法

進化的計算手法の並列計算機への実装三木光範

階層的位置表現への広域化ビュー適用における追尾性向上

2009年12月4日 ○ 前田康成（北見工業大学）吉田秀樹（北見工業大学）鈴木正清（北見工業大学）松嶋敏泰（早稲田大学）

ロボットの協調動作の研究：マップ作成とマップ情報を利用した行動計画

Data Clustering: A Review

Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水洋志.

電機情報工学専門実験 6. 強化学習シミュレーション

片方向通信路を含むネットワークアーキテクチャに於ける動的な仮想リンク制御機構の設計と実装

プログラミングを体験しよう選択情報⑧.

適応的近傍を持つシミュレーテッドアニーリングの性能

コードクローン分類の詳細化に基づく集約パターンの提案と評価

P2P ネットワーク上で実時間ストリーミングを実現するための分散制御プロトコルの提案

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

シミュレーション論Ⅰ 第7回シミュレーションの構築と実施.

ISO23950による分散検索の課題とその解決案に関する検討

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

「マイグレーションを支援する分散集合オブジェクト」

オブジェクトの動的支配関係解析を用いたシーケンス図の縮約

交通渋滞予測システムの作成と評価白井研究室 T 杉浦直季

表紙分散遺伝的アルゴリズムのための新しい交叉法.

タンク内圧力の変動を考慮したコンプレッサーの能動騒音制御

エイリアス関係を考慮した Javaプログラム用静的スライシングツール

IPmigrate：複数ホストに分割されたVMのマイグレーション手法

MPIを用いた並列処理情報論理工学研究室 06‐1‐037‐0246　杉所　拓也.

インセンティブにより自律ユーザに高品質なオーバーレイマルチキャスト木を構築させるプロトコルの提案

実都市を対象とした初期マイクロデータの推定手法の適用と検証

Presentation transcript:

ITSにおける知的ネットワークシステムの構築 - 知的信号機システムの提案 - ○ 中島史裕（同志社大院）廣安知之（同志社大工）三木光範（同志社大工）

具体的なネットワークシステムの構成方法の検討．研究背景自律分散型のネットワークシステムインターネットの普及に伴うシステムのネットワーク化．具体的なネットワークシステムの構成方法の検討． ITSに適用し，その有効性を検証．知的ネットワークシステム EX. 知的照明システム

人・道路・車のネットワーク化による各種の問題解決研究背景人・道路・車のネットワーク化による各種の問題解決 ITS（高度道路交通システム）交差点における交通管理の役割を果たす信号機が重要渋滞問題発生箇所のほとんどが交差点や合流部知的信号機システム

知的信号機システム独立型知的信号機システム自律分散システムネットワーク型知的信号機システム知的ネットワークシステム信号機システム信号機システムにおける自律分散システムの有効性の検証，および強化学習の学習方法の検討．ネットワーク型知的信号機システム知的ネットワークシステム信号機システム知的ネットワークシステムの有効性の検証．

知的信号機システム目的交通渋滞を減少させる．交通量を取得．強化学習により自律的に判断基準を生成し，最適な動作を決定．・信号機のサイクルを調節．・信号機の青，赤の切り替え． Sense Judge Act

「状態st」と「行動at」の組に対する評価（Q値）を見積もる．強化学習 Q-Learning 「状態st」と「行動at」の組に対する評価（Q値）を見積もる．異なる「状態」と「行動」を設定したシステムを提案し，その有効性を検証． Q値を与える「状態」と「行動」の設定が重要 α：学習率（0<α≦1），γ：割引率（0≦γ≦1）

「状態」と「行動」の設定状態行動状態1：交差点単位の累積交通量状態2：交差点の渋滞パターン行動1：サイクル値の増減行動2：信号機の状態（青・赤）の決定

状態1(交差点単位の累積交通量） Sense X1 X4 X3 X2 X1=0～9 Time Q-Learning 累積 X1～X4の合計

状態2（交差点の渋滞パターン）各交差点の渋滞状況をパターン化（全51状態）・・・ LV.1渋滞 LV.2渋滞・・・ LV.1渋滞 LV.2渋滞各交差点の渋滞状況をパターン化（全51状態）交差点から車が3～5台連続している場合交差点から車が6台以上連続している場合 1 2 3 4 5 16 17 18 50

行動行動1（サイクル値の増減） Act(1) Act(2) 行動2（信号機の状態の決定）横方向の青信号（赤信号）の時間を短縮（延長）する． Act(1) 横方向の青信号（赤信号）の時間を延長（短縮）する． Act(2) 横方向の信号機を赤（縦方向を青）にする．横方向の信号機を青（縦方向を赤）にする．

独立型知的信号機システム知的信号機システム1 知的信号機システム2 知的信号機システム3 交差点単位の累積交通量サイクル値の増減交差点の渋滞パターン信号機の状態（青・赤）の決定知的信号機システム2 知的信号機システム3 状態行動「状態」設定の検証「行動」設定の検証

Q-Learningにおけるパラメータ設定学習率α：　　　　0.07 割引率γ：　　　　0.9 行動選択方法：　Boltzmann選択 Q値の初期値：　 0.1 温度定数T：　 0.2

各交差点の累積交通量を計算し，これを状態とする．決められた行動選択方法により行動を決定し，実行する．知的信号機システム1 各交差点の交通量を取得．各交差点の累積交通量を計算し，これを状態とする． Q値を更新する．決められた行動選択方法により行動を決定し，実行する．報酬を受け取る．前の状態（累積交通量）と比べて，交通量が減少していた場合に報酬1を与える． Act(1)：横方向の青信号（赤信号）の時間を短縮（延長）． Act(2)：横方向の青信号（赤信号）の時間を延長（短縮）．

各交差点の渋滞パターンを計算し，状態とする．決められた行動選択方法により行動を決定し，実行する．知的信号機システム2 各交差点の交通量を取得．各交差点の渋滞パターンを計算し，状態とする． Q値を更新する．決められた行動選択方法により行動を決定し，実行する．報酬を受け取る．・渋滞なしの場合に報酬10．・LV.2渋滞→LV.1渋滞の場合に報酬1． Act(1)：横方向の青信号（赤信号）の時間を短縮（延長）． Act(2)：横方向の青信号（赤信号）の時間を延長（短縮）．

各交差点の渋滞パターンを計算し，状態とする．決められた行動選択方法により行動を決定し，実行する．知的信号機システム3 各交差点の交通量を取得．各交差点の渋滞パターンを計算し，状態とする． Q値を更新する．決められた行動選択方法により行動を決定し，実行する．報酬を受け取る．・渋滞なしの場合に報酬2．・LV.2渋滞→LV.1渋滞の場合に報酬1． Act(1)：横方向の信号機を赤にする． Act(2)：横方向の信号機を青にする．

・発生時の進行方向を目的方向とし，基本的に直進．・交差点先が渋滞している場合は左折後，右折して回避．シミュレーションの環境道路：　4×4の格子状(16交差点) 車発生確率：　一定スプリット：　1:1(青：赤）基本サイクル：　80(steps) 車の動作・発生時の進行方向を目的方向とし，基本的に直進．・交差点先が渋滞している場合は左折後，右折して回避．車発生比率：　上から3本目が2，他1．動作方法：　セルラーオートマトン

信号機故障時のシミュレーション信号機が故障した時に発生する渋滞への対応をシミュレーションで検証． 5000(steps)に信号機が故障（全て赤信号）．周囲の交通状況に影響

「状態」に関する比較

「状態」に関する考察縦・横の交通流が明示的な「状態」の設定が必要．交差点単位の累積交通量（知的信号機システム1）交差点の渋滞パターン（知的信号機システム2）同じ状態状態(9) 9台 Q値の差が開かない．異なる状態状態(17) 状態(18) Q値の差が開く．縦・横の交通流が明示的な「状態」の設定が必要．「交差点の渋滞パターン」が有効．

「行動」に関する比較

「行動」に関する考察直接的に「状態」を変化させる「行動」の設定が必要．サイクル値の増減（知的信号機システム2）サイクル値の増減　　　　（知的信号機システム2）信号機の状態の決定（知的信号機システム3）信号機の時間を変化させる．信号機の状態を変化させる．直接的に「状態」を変化させる「行動」の設定が必要．「信号機の状態の決定」が有効． Act(2) 良い「行動」をとっても「状態」に反映されない場合がある．良い「行動」が「状態」に必ず反映される．状態(0) 状態(1)

交通流を限定したシミュレーション交通流を上から3本目の左方向のみにすることで，学習効果が明確になる．途中から信号機を故障させることで，車の流れが変わる．交通流に沿って青信号が続くような「行動」を選択するようになる．

知的信号機システム3のアルゴリズムを用いた知的ネットワークシステムの適用独立型知的信号機システムにおける考察知的信号機システム3 強化学習により，信号機システムにおける自律分散システムの有効性が検証できた．状態行動信号機の状態の決定交差点の渋滞パターン知的信号機システム3のアルゴリズムを用いた知的ネットワークシステムの適用

ネットワーク型知的信号機システム知的信号機システム3(a) 知的信号機システム3(b) ネットワーク化による有効性の検証． 4近傍の交差点の交通量情報を参照．周辺を含めた広域の交通量の減少を目的とする．目的交差点の交通量情報を参照．一つの交差点の交通量の減少を目的とする．知的ネットワークシステム信号機システム

各交差点の渋滞パターンを計算し，状態とする．決められた行動選択方法により行動を決定し，実行する．知的信号機システム3(a) 各交差点の交通量を取得．各交差点の渋滞パターンを計算し，状態とする． Q値を更新する．決められた行動選択方法により行動を決定し，実行する．報酬を受け取る． Act(1)：横方向の信号機を赤にする． Act(2)：横方向の信号機を青にする．・前状態に比べて，各交差点とその4近傍の交通量の和が15台以上減少した場合に報酬2．

各交差点の渋滞パターンを計算し，状態とする．決められた行動選択方法により行動を決定し，実行する．知的信号機システム3(b) ・目的交差点の状態が渋滞なしの場合に報酬2．・目的交差点の状態がLV.2渋滞→LV.1渋滞の場合に報酬1．各交差点の交通量を取得．各交差点の渋滞パターンを計算し，状態とする． Q値を更新する．決められた行動選択方法により行動を決定し，実行する．報酬を受け取る． Act(1)：横方向の信号機を赤にする． Act(2)：横方向の信号機を青にする．

広域の交通量を参照した結果

知的信号機システム3(a)におけるシミュレーション結果の考察ネットワークを介して，他の信号機のSense部を利用． 4近傍の信号機のSense部が取得した交通量情報を参照．広域の交通量の減少が目的

目的交差点の交通量を参照した結果

知的信号機システム3(b)におけるシミュレーション結果の考察目的交差点他の交差点信号機のAct部を利用．他の交差点目的交差点信号機のSense部を利用．ネットワークを介して，他の信号機のSense部やAct部を利用．

結論1 信号機システムにおいて，自律分散システムおよび知的ネットワークシステムは有効である．・自律分散システムの信号機システムへの適用．・知的人工物のJudge部におけるQ-Learningの適用．シミュレーション結果から，従来型の信号機システムに比べ，良い性能を示した．信号機システムにおいて，自律分散システムおよび知的ネットワークシステムは有効である．・知的ネットワークシステムの信号機システムへの適用．

結論2 ・Q値を与える「状態」および「行動」の設定が重要．・縦と横の交通流を明示的にする「状態」の設定．・直接的に状態を変化させるような「行動」の設定．・縦と横の交通流を明示的にする「状態」の設定．・信号機故障の場合，他の信号機により機能低下を補うことが可能．・Q値を与える「状態」および「行動」の設定が重要．・ネットワーク化により，他の信号機のSense部およびAct部の有効利用が可能．

今後の課題・知的信号機システムに与える目的の設定方法．・強化学習における他手法との比較．・Q値における動的変化の検討． - 突発的な環境変化に対する柔軟性の欠如の可能性． - 一定時間毎に初期状態に近づけるQ値の動的変化．

補足：信号機のサイクル赤青 time Cycle time

補足：Q値の更新状況（知的信号機システム3） *******Step1000のQ値******* 信号機3 q0(0) 1.36644771261504 q0(1) 2.034504053187063 q1(0) 0.11687912507441091 q1(1) 0.48950989456202426 q2(0) 0.15465956227040462 q2(1) 1.1276795869646143 q3(0) 0.6289013133037114 q3(1) 0.10674727318193139 q4(0) 1.4330664071220742 q4(1) 0.12793975804885488 q5(0) 0.15802097596076287 q5(1) 0.6511083772538838 q6(0) 0.30101107434937613 q6(1) 0.0993 ・　　　　　　・ *******Step10000のQ値******* q0(0) 1.5380964883540666 q0(1) 10.767915416687488 q2(1) 7.300104284382606 q3(0) 9.720320868541936 q4(0) 10.072004246927069 q6(0) 9.080670332151792

1 2 3 4 5 6 7 8 9 10 11 12 15 16 17 18 19 20 14 13 21 24 23 22 27 26 25 30 29 28 33 32 31 36 34 35 39 38 37 41 42 40 44 45 43 50 48 49 47 46 LV.1渋滞 LV.2渋滞

補足：知的人工物知的ネットワークシステム知的人工物知的人工物をネットワークにつなぎ，システム化させたもの．外部環境をセンス Sense Judge Act 外部環境をセンス最適動作を計画実行知的ネットワークシステム

補足：知的ネットワークシステム主制御器が存在せず，ネットワークに接続されている各機器（知的人工物）がそれぞれ自律的に動作する．目的

・1つの機器では不可能な作業を行うことができる．・機器のネットワークへの参入・離脱が容易である．補足：知的ネットワークシステムの特徴・1つの機器では不可能な作業を行うことができる．・機器のネットワークへの参入・離脱が容易である．・ある機器の故障時に起こる機能低下を他機器で　柔軟に対応し，補うことができる．・ネットワークに「目的」を与えておくだけで自律的に行動し，目的を達成する．・既存機器のみで新しい機能を生み出せる．・ネットワークの機能を有していれば，システムに接続する知的人工物の種類は問わない．