位置センサ情報を用いた ユーザの行動傾向の取得 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 ○ 柳沢 豊,赤埴 淳一,小暮 潔
概要 ユーザの実世界中での移動履歴から,ユーザ の行動傾向を抽出する実験 発表内容 – 背景・アプリケーション例 – 研究の目的 – 位置センサシステム – データ分析方法 – 実験 – まとめ
背景 インターネット上にある莫大な情報から いかに必要な情報を取捨選択するか? 既存技術:情報フィルタリング ユーザのコンピュータ上での操作内容から ユーザの興味や嗜好を取得し,情報を選択する. しかし,ユーザの実世界中での行動内容は反映されない.
例題(1) 道路工事情報 よく通る地点の 情報が欲しい. Lab × × × × × × × × × × 工事地点 A B C D E F G H I
例題(1) 道路工事情報 Lab 通勤路 日常の行動情報を 取得しておく.
例題(1) 道路工事情報 Lab 工事情報 地点 A: 通行止め 地点 B: 片道交互 地点 C: … 地点 D: …. 工事情報 地点 A: 通行止め 地点 B: 片道交互 地点 C: … 地点 D: …. よく通る道の情報の 優先度を上げて表示. × × × × × × × × × A B C D E F G H I
例題(2) コピー機についてのお報せ コピー機情報! 両面印刷機能が追加されました. もう手作業で両面印刷する必要 はありません! コピー機情報! 両面印刷機能が追加されました. もう手作業で両面印刷する必要 はありません! 掲示を出す. コピー機を使うユーザには有益だが, 使わないユーザにとってはノイズ 両面印刷機能を追加! 両面印刷
例題(2) コピー機についてのお報せ ユーザがよく使う 機器の情報を取得 しておく. コピー機情報! 両面印刷機能が追加されました. もう手作業で両面印刷する必要 はありません! コピー機情報! 両面印刷機能が追加されました. もう手作業で両面印刷する必要 はありません! コピー機をよく使うユーザなら 情報を表示する. フィルタリング
要点1 よく行く場所,よく使うものをキー ワードに使うことで,効率の良いフィ ルタリングができる. 頻出行動
例題(3) 道路工事情報 場合によって 欲しい情報が 違うことがある. Lab × × × × × × × × 工事地点 C D E F G H I Shop × × A B
例題(3) 道路工事情報 平日朝 8 時なら通勤 Lab × 工事地点 × × × × × × × C D E F G H I Shop 通勤経路上の 情報を優先的に 表示する. × × A B
例題(3) 道路工事情報 休日昼 1 時なら買物 Lab × 工事地点 Shop 買物先までの 経路上の情報を 表示する. × × × × × × C D E F H I × × A B × G
要点2 時と場合によって欲しい情報が違うこ とがある. ユーザが日頃よく取る行動の順序にみ られる癖(傾向)がわかれば,ユーザ の状況にあわせて収集する情報を変え ることができる. 行動順序
問題点 従来は,ユーザ自身が「よく通る道」「よく 使うコピー機」という情報をコンピュータに 入力しなければならなかった 入力する情報量が多すぎて,ユーザにかかる 負荷が高くなってしまう. 情報を自動で入力できないか?
アプローチ ユーザと場所・物・行動などとの関連の深さか が分かれば,それをキーにしてフィルタリング できる. – ユーザの日常行動をセンシングし,よく使う物やよ く行く場所を見つけ出せばよい. ユーザの日常行動をセンシングしてデータを分析し, ユーザの行動傾向(頻出行動,行動順序)を見つける. ユーザの日常行動をセンシングしてデータを分析し, ユーザの行動傾向(頻出行動,行動順序)を見つける. 研究の目的
研究の内容 関連性取得の予備的な実験を行う. – 人間の基礎的な行動である「移動」「滞在」 をセンシングする. – そのデータからユーザに関する行動傾向を取 得できるか実験を行う.
全体の流れ DB 位置センサデータ データを集める. 分析 エンジン Data Mining 技術 ユーザの行動を分析 場所 物 フィルタ Filtering 技術 情報の取捨選択
位置の取得方法 (1) 位置検出を行うセンサを環境とユーザ の双方に取り付ける. DB に蓄積されたデータからユーザの移 動経路を計算する. DB 赤外線位置検出センサ DB モーションセンサ
位置の取得方法 (2) 装着型センサのデータを環境設置型センサで 補正する. ノート PC PC サーバ 統合サーバ モーション センサ 赤外線センサ 加速度センサ 地磁気センサ センサ情報送受信プロセス 位置計算プロセス ログ 赤外線受信機 位置検出プロセス 速度情報 (無線 LAN 経由) 位置情報 ( LAN 経由) 地形図 修正された 位置情報 PC サーバ 全体の処理
モーションセンサの装備例 赤外線バッジ 加速度センサ 地磁気センサ ノートパソコ ン
赤外線センサの配置 センサ
得られたデータの例 実際に歩いた経路 (赤:往路 / 青:復路) センサにより 追跡された経路 環境設置型センサにより 位置補正された個所 5m
データの分析 「存在位置」「滞在時間」を使って行 動をクラスタリングする. 得られた行動リストの中から,よく行 われる行動(頻出行動)と,行動間の 順序特性(行動順序)を探す.
「行動」の抽出 滞在時間を使って行動をクラスタリン グする. 移動経路 A C 滞在の度合いで 領域を分ける. B t B C A 0-30sec sec 0-30sec さらに滞在時間の 長さで分類する. 行動
行動傾向の抽出 得られた「行動」の中で,一定数以上 のものを頻出行動として抽出する. 行動順序を見つける.
実験 ユーザの位置データを取得して行動傾 向を取得する簡単な実験を行った. – 主に赤外線センサのデータを使用 – ユーザ 1 人のデータ 7 日分( 60 時間分)
頻出行動 頻度時間場所 行動 自室 一時滞在 部外 ー 7 ∞ 自室 帰宅 6 30 部外 通過 5 30 通路 通過 通路 通過 自室 仕事 自室 仕事 通路 会議? 部外 ? 通路 2 会議? 部外 食事他 部外 通路 休憩 自室 通路 2
頻出行動 フィルタリングに用いることができる 情報: – 自室に滞在していることが非常に多い. -> 「自室」に関する情報は有益である. – 通路はほとんど通過するだけである. -> 「通路」については,通行障害に関する 情報以外はあまり重要ではない. – 休憩室にはほとんど滞在しない. -> 「休憩室」に関する情報は重要ではない.
行動順序( 2 行動間) 部外 通路 休憩 自室 通路 2 頻度時間場所場所時間 630 自室部外 部外自室 通路部外 自室部外 自室通路 部外自室 部外通路 通路 2 自室 ∞ 230 部外自室 部外自室 通路部外 通路自室 30 注 ) 図内の矢印は時間情報を無視している
行動順序( 2 行動間) 部外 通路 休憩 自室 通路 2 頻度時間場所場所時間 630 自室部外 部外自室 通路部外 自室部外 自室通路 部外自室 部外通路 通路 2 自室 ∞ 230 部外自室 部外自室 通路部外 通路自室 30 注 ) 図内の矢印は時間情報を無視している
行動順序( 2 順序間) フィルタリングに用いることができる 情報: – 自室と部外を直接往復するケースが多い. – 自室には一瞬居てすぐ部外に出るか,ある いは 1 時間程度いてから部外に出る.
行動順序( 3 行動間) 部外 通路 休憩 自室 通路 2 頻度場所場所場所 11 自室部外自室 10 部外自室部外 8 通路部外自室 7 自室通路 部外 5 部外自室通路 4 休憩通路 2 自室 4 部外自室通路 2 3 自室通路自室 3 自室部外通路
考察 位置と滞在時間を使うことで,ある程 度行動を特定できる. 課題 – ユーザ数を増やし,ユーザ間の相関関係を 取得する実験を行う. –PC の操作履歴なども解析に含める. – 時間的に離れた行動間の相関性も解析する.
まとめ 移動履歴を取得するセンサ環境を作った. ユーザの行動傾向を抽出する予備的な実 験を行った. 今後の予定: – より大規模な環境下での実験を行う.
研究の位置付け( A ) センシング (Ubiquitous Sensing) 推論, プランニング, 情報フィルタリング データマイニング (UDM) 選択的データ統合 行動情報取得 基礎技術 行動傾向の分析応用技術 要素技術 本研究
センシング 研究の位置付け( B ) データマイニング 分散データ マイニング ユビキタスデータマイニング 情報フィルタリング 本研究
位置データの取得方法 加速度センサ,地磁気センサでユーザ の移動速度と方向を取得.屋外では GPS を利用する. 環境に設置したセンサでユーザの大ま かな位置を取得する. 双方のデータを組み合わせて精度の高 い位置情報を取得する.
行動傾向分析のイメージ センサ情報 行動内容 2001/09/11 11:00:01 ID:534afg [x:100,y:200,z:300] 2001/09/11 11:00:10 ID:562xde [x:010,y:220,z:400] 2001/09/11 11:00:30 ID:534afg [x:150,y:260,z:300] …. 2001/09/11 11:00:01 柳沢 [ 居室 ] 2001/09/11 11:00:10 小暮 [ デモルーム ] 2001/09/11 11:00:30 柳沢 [ 休憩室 ] …. 行動傾向 柳沢 [ 居室 : sec] -> [ 休憩室 :0-30sec] 柳沢 [ 部外 :0-30sec] -> [ 居室 : sec] 小暮 [ 居室 :60-300sec]->[ デモルーム : sec] …. 記号化 分析