ITSにおける 知的ネットワークシステムの構築 - 知的信号機システムの提案 -

Slides:



Advertisements
Similar presentations
静岡大学情報学研究科 戸根木千洋 ユーザーイメージ収集 インターフェースの開発. 2 目次 背景と目的 研究の構成 研究の詳細 イメージ収集インターフェースの提案 映画イメージ収集システムの開発 システムの評価 今後の課題.
Advertisements

HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
ユーザーイメージ収集 インターフェイスの開発
Web アプリをユーザー毎に カスタマイズ可能にする AOP フレームワーク
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
Actor-Criticを用いた 知的ネットワークシステムの提案
最新ファイルの提供を保証する代理FTPサーバの開発
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
視線に基づくサブゴールを用いた 歩行者の行動モデル
知的ネットワークシステムへの 強化学習の適用
ここに若林の絵が入る Ⅰ 従来型サービスの課題 Ⅴ Solaris基盤ヘルスチェックサービス ●従来型サービス Ⅱ 新サービスの概要
ラウンドトリップタイムを指標とした 無線LAN のためのアクセスポイント選択手法
府中都市計画道路3・3・8号 府中所沢線整備事業
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
神奈川大学大学院工学研究科 電気電子情報工学専攻
シミュレーション論 Ⅱ 第12回 強化学習.
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
ネットワークの基礎技術.
先端論文紹介ゼミ Role-based Context-specific Multiagent Q-learning
エージェントアプローチ 人工知能 21章 B4 片渕 聡.
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
Towards Commercial Mobile Ad Hoc Network Applications: A Radio Dispatch System ECN M1 sada.
【会議の進め方】会議の定義:問題を解決する場であり情報を共有する場ではない 作成:増永寛之
交通量観測地点を考慮した時間OD推定 モデルの開発と大規模ネットワークへの適用
ITS(高度道路交通システム)とは何か?
画像情報を用いた交通流計測 情報工学科 藤吉研究室 EP02076 都築勇司
3次元剛体運動の理論と シミュレーション技法
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
大気レーダーのアダプティブクラッタ 抑圧法の開発
シミュレーション論 Ⅱ 第12回 様々なシミュレーション手法(3) 強化学習.
KECSフォーラム Intelligent Systems --
協調機械システム論 ( ,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
1DS05175M 安東遼一 1DS05213M 渡邉光寿 指導教員: 高木先生
アップデート 株式会社アプライド・マーケティング 大越 章司
第14章 モデルの結合 修士2年 山川佳洋.
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
進化的計算手法の並列計算機への実装 三木 光範
階層的位置表現への 広域化ビュー適用における追尾性向上
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
ロボットの協調動作の研究: マップ作成とマップ情報を利用した行動計画
Data Clustering: A Review
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
電機情報工学専門実験 6. 強化学習シミュレーション
片方向通信路を含む ネットワークアーキテクチャに於ける 動的な仮想リンク制御機構の設計と実装
プログラミングを 体験しよう 選択情報⑧.
適応的近傍を持つ シミュレーテッドアニーリングの性能
コードクローン分類の詳細化に基づく 集約パターンの提案と評価
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
シミュレーション論Ⅰ 第7回 シミュレーションの構築と実施.
ISO23950による分散検索の課題と その解決案に関する検討
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
「マイグレーションを支援する分散集合オブジェクト」
オブジェクトの動的支配関係解析を 用いたシーケンス図の縮約
交通渋滞予測システムの作成と評価 白井研究室 T 杉浦直季
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
タンク内圧力の変動を考慮した コンプレッサーの能動騒音制御
エイリアス関係を考慮した Javaプログラム用静的スライシングツール
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
インセンティブにより自律ユーザに 高品質なオーバーレイマルチキャスト木を 構築させるプロトコルの提案
実都市を対象とした初期マイクロデータの 推定手法の適用と検証
Presentation transcript:

ITSにおける 知的ネットワークシステムの構築 - 知的信号機システムの提案 - ○ 中島 史裕(同志社大院)廣安 知之(同志社大工)三木 光範(同志社大工)

具体的なネットワークシステムの構成方法の検討. 研究背景 自律分散型のネットワークシステム インターネットの普及に伴うシステムのネットワーク化. 具体的なネットワークシステムの構成方法の検討. ITSに適用し,その有効性を検証. 知的ネットワークシステム EX. 知的照明システム

人・道路・車のネットワーク化による各種の問題解決 研究背景 人・道路・車のネットワーク化による各種の問題解決 ITS(高度道路交通システム) 交差点における交通管理の役割を果たす信号機が重要 渋滞問題 発生箇所のほとんどが交差点や合流部 知的信号機システム

知的信号機システム 独立型知的信号機システム 自律分散システム ネットワーク型知的信号機システム 知的ネットワークシステム 信号機システム 信号機システムにおける自律分散システムの有効性の検証,および強化学習の学習方法の検討. ネットワーク型知的信号機システム 知的ネットワークシステム 信号機システム 知的ネットワークシステムの有効性の検証.

知的信号機システム 目的 交通渋滞を減少させる. 交通量を取得. 強化学習により自律的に判断基準を生成し,最適な動作を決定. ・信号機のサイクルを調節. ・信号機の青,赤の切り替え. Sense Judge Act

「状態st」と「行動at」の組に対する評価(Q値)を見積もる. 強化学習 Q-Learning 「状態st」と「行動at」の組に対する評価(Q値)を見積もる. 異なる「状態」と「行動」を設定したシステムを提案し,その有効性を検証. Q値を与える「状態」と「行動」の設定が重要 α:学習率(0<α≦1),γ:割引率(0≦γ≦1)

「状態」と「行動」の設定 状態 行動 状態1:交差点単位の累積交通量 状態2:交差点の渋滞パターン 行動1:サイクル値の増減 行動2:信号機の状態(青・赤)の決定

状態1(交差点単位の累積交通量) Sense X1 X4 X3 X2 X1=0~9 Time Q-Learning 累積 X1~X4の合計

状態2(交差点の渋滞パターン) 各交差点の渋滞状況をパターン化(全51状態) ・・・ LV.1渋滞 LV.2渋滞 ・・・ LV.1渋滞 LV.2渋滞 各交差点の渋滞状況をパターン化(全51状態) 交差点から車が3~5台連続している場合 交差点から車が6台以上連続している場合 1 2 3 4 5 16 17 18 50

行動 行動1(サイクル値の増減) Act(1) Act(2) 行動2(信号機の状態の決定) 横方向の青信号(赤信号)の時間を短縮(延長)する. Act(1) 横方向の青信号(赤信号)の時間を延長(短縮)する. Act(2) 横方向の信号機を赤(縦方向を青)にする. 横方向の信号機を青(縦方向を赤)にする.

独立型知的信号機システム 知的信号機システム1 知的信号機システム2 知的信号機システム3 交差点単位の累積交通量 サイクル値の増減 交差点の渋滞パターン 信号機の状態(青・赤)の決定 知的信号機システム2 知的信号機システム3 状態 行動 「状態」設定の検証 「行動」設定の検証

Q-Learningにおけるパラメータ設定 学習率α:    0.07 割引率γ:    0.9 行動選択方法: Boltzmann選択 Q値の初期値:  0.1 温度定数T:  0.2

各交差点の累積交通量を計算し,これを状態とする. 決められた行動選択方法により行動を決定し,実行する. 知的信号機システム1 各交差点の交通量を取得. 各交差点の累積交通量を計算し,これを状態とする. Q値を更新する. 決められた行動選択方法により行動を決定し,実行する. 報酬を受け取る. 前の状態(累積交通量)と比べて,交通量が減少していた場合に報酬1を与える. Act(1):横方向の青信号(赤信号)の時間を短縮(延長) . Act(2):横方向の青信号(赤信号)の時間を延長(短縮) .

各交差点の渋滞パターンを計算し,状態とする. 決められた行動選択方法により行動を決定し,実行する. 知的信号機システム2 各交差点の交通量を取得. 各交差点の渋滞パターンを計算し,状態とする. Q値を更新する. 決められた行動選択方法により行動を決定し,実行する. 報酬を受け取る. ・渋滞なしの場合に報酬10. ・LV.2渋滞→LV.1渋滞の場合に報酬1. Act(1):横方向の青信号(赤信号)の時間を短縮(延長) . Act(2):横方向の青信号(赤信号)の時間を延長(短縮) .

各交差点の渋滞パターンを計算し,状態とする. 決められた行動選択方法により行動を決定し,実行する. 知的信号機システム3 各交差点の交通量を取得. 各交差点の渋滞パターンを計算し,状態とする. Q値を更新する. 決められた行動選択方法により行動を決定し,実行する. 報酬を受け取る. ・渋滞なしの場合に報酬2. ・LV.2渋滞→LV.1渋滞の場合に報酬1. Act(1):横方向の信号機を赤にする. Act(2):横方向の信号機を青にする.

・発生時の進行方向を目的方向とし,基本的に直進. ・交差点先が渋滞している場合は左折後,右折して回避. シミュレーションの環境 道路: 4×4の格子状(16交差点) 車発生確率: 一定 スプリット: 1:1(青:赤) 基本サイクル: 80(steps) 車の動作 ・発生時の進行方向を目的方向とし,基本的に直進. ・交差点先が渋滞している場合は左折後,右折して回避. 車発生比率: 上から3本目が2,他1. 動作方法: セルラーオートマトン

信号機故障時のシミュレーション 信号機が故障した時に発生する渋滞への対応をシミュレーションで検証. 5000(steps)に信号機が故障(全て赤信号). 周囲の交通状況に影響

「状態」に関する比較

「状態」に関する考察 縦・横の交通流が明示的な「状態」の設定が必要. 交差点単位の累積交通量(知的信号機システム1) 交差点の渋滞パターン(知的信号機システム2) 同じ状態 状態(9) 9台 Q値の差が開かない. 異なる状態 状態(17) 状態(18) Q値の差が開く. 縦・横の交通流が明示的な「状態」の設定が必要. 「交差点の渋滞パターン」が有効.

「行動」に関する比較

「行動」に関する考察 直接的に「状態」を変化させる「行動」の設定が必要. サイクル値の増減 (知的信号機システム2) サイクル値の増減    (知的信号機システム2) 信号機の状態の決定(知的信号機システム3) 信号機の時間を変化させる. 信号機の状態を変化させる. 直接的に「状態」を変化させる「行動」の設定が必要. 「信号機の状態の決定」が有効. Act(2) 良い「行動」をとっても「状態」に反映されない場合がある. 良い「行動」が「状態」に必ず反映される. 状態(0) 状態(1)

交通流を限定したシミュレーション 交通流を上から3本目の左方向のみにすることで,学習効果が明確になる. 途中から信号機を故障させることで,車の流れが変わる. 交通流に沿って青信号が続くような「行動」を選択するようになる.

知的信号機システム3のアルゴリズムを用いた知的ネットワークシステムの適用 独立型知的信号機システムにおける考察 知的信号機システム3 強化学習により,信号機システムにおける自律分散システムの有効性が検証できた. 状態 行動 信号機の状態の決定 交差点の渋滞パターン 知的信号機システム3のアルゴリズムを用いた知的ネットワークシステムの適用

ネットワーク型知的信号機システム 知的信号機システム3(a) 知的信号機システム3(b) ネットワーク化による有効性の検証. 4近傍の交差点の交通量情報を参照. 周辺を含めた広域の交通量の減少を目的とする. 目的交差点の交通量情報を参照. 一つの交差点の交通量の減少を目的とする. 知的ネットワークシステム 信号機システム

各交差点の渋滞パターンを計算し,状態とする. 決められた行動選択方法により行動を決定し,実行する. 知的信号機システム3(a) 各交差点の交通量を取得. 各交差点の渋滞パターンを計算し,状態とする. Q値を更新する. 決められた行動選択方法により行動を決定し,実行する. 報酬を受け取る. Act(1):横方向の信号機を赤にする. Act(2):横方向の信号機を青にする. ・前状態に比べて,各交差点とその4近傍の交通量の和が15台以上減少した場合に報酬2.

各交差点の渋滞パターンを計算し,状態とする. 決められた行動選択方法により行動を決定し,実行する. 知的信号機システム3(b) ・目的交差点の状態が渋滞なしの場合に報酬2. ・目的交差点の状態がLV.2渋滞→LV.1渋滞の場合に報酬1. 各交差点の交通量を取得. 各交差点の渋滞パターンを計算し,状態とする. Q値を更新する. 決められた行動選択方法により行動を決定し,実行する. 報酬を受け取る. Act(1):横方向の信号機を赤にする. Act(2):横方向の信号機を青にする.

広域の交通量を参照した結果

知的信号機システム3(a)におけるシミュレーション結果の考察 ネットワークを介して,他の信号機のSense部を利用. 4近傍の信号機のSense部が取得した交通量情報を参照. 広域の交通量の減少が目的

目的交差点の交通量を参照した結果

知的信号機システム3(b)におけるシミュレーション結果の考察 目的交差点 他の交差点信号機のAct部を利用. 他の交差点 目的交差点信号機のSense部を利用. ネットワークを介して,他の信号機のSense部やAct部を利用.

結論1 信号機システムにおいて,自律分散システムおよび知的ネットワークシステムは有効である. ・自律分散システムの信号機システムへの適用. ・知的人工物のJudge部におけるQ-Learningの適用. シミュレーション結果から,従来型の信号機システムに比べ,良い性能を示した. 信号機システムにおいて,自律分散システムおよび知的ネットワークシステムは有効である. ・知的ネットワークシステムの信号機システムへの適用.

結論2 ・Q値を与える「状態」および「行動」の設定が重要. ・縦と横の交通流を明示的にする「状態」の設定. ・直接的に状態を変化させるような「行動」の設定. ・縦と横の交通流を明示的にする「状態」の設定. ・信号機故障の場合,他の信号機により機能低下を補うことが可能. ・Q値を与える「状態」および「行動」の設定が重要. ・ネットワーク化により,他の信号機のSense部およびAct部の有効利用が可能.

今後の課題 ・知的信号機システムに与える目的の設定方法. ・強化学習における他手法との比較. ・Q値における動的変化の検討. - 突発的な環境変化に対する柔軟性の欠如の可能性. - 一定時間毎に初期状態に近づけるQ値の動的変化.

補足:信号機のサイクル 赤 青 time Cycle time

補足:Q値の更新状況(知的信号機システム3) *******Step1000のQ値******* 信号機3 q0(0) 1.36644771261504 q0(1) 2.034504053187063 q1(0) 0.11687912507441091 q1(1) 0.48950989456202426 q2(0) 0.15465956227040462 q2(1) 1.1276795869646143 q3(0) 0.6289013133037114 q3(1) 0.10674727318193139 q4(0) 1.4330664071220742 q4(1) 0.12793975804885488 q5(0) 0.15802097596076287 q5(1) 0.6511083772538838 q6(0) 0.30101107434937613 q6(1) 0.0993 ・      ・ *******Step10000のQ値******* q0(0) 1.5380964883540666 q0(1) 10.767915416687488 q2(1) 7.300104284382606 q3(0) 9.720320868541936 q4(0) 10.072004246927069 q6(0) 9.080670332151792

1 2 3 4 5 6 7 8 9 10 11 12 15 16 17 18 19 20 14 13 21 24 23 22 27 26 25 30 29 28 33 32 31 36 34 35 39 38 37 41 42 40 44 45 43 50 48 49 47 46 LV.1渋滞 LV.2渋滞

補足:知的人工物 知的ネットワークシステム 知的人工物 知的人工物をネットワークにつなぎ,システム化させたもの. 外部環境をセンス Sense Judge Act 外部環境をセンス 最適動作を計画 実行 知的ネットワークシステム

補足:知的ネットワークシステム 主制御器が存在せず,ネットワークに接続されている各機器(知的人工物)がそれぞれ自律的に動作する. 目的

・1つの機器では不可能な作業を行うことができる. ・機器のネットワークへの参入・離脱が容易である. 補足:知的ネットワークシステムの特徴 ・1つの機器では不可能な作業を行うことができる. ・機器のネットワークへの参入・離脱が容易である. ・ある機器の故障時に起こる機能低下を他機器で  柔軟に対応し,補うことができる. ・ネットワークに「目的」を与えておくだけで自律的に行動し,目的を達成する. ・既存機器のみで新しい機能を生み出せる. ・ネットワークの機能を有していれば,システムに接続する知的人工物の種類は問わない.