複数活動履歴を基にしたユーザの関心情報の抽出

Slides:



Advertisements
Similar presentations
IBMユーザ研究会九州研T3 3.Web2.0を実際に使ってみた. Web2.0を実際に使ってみました 研究会をプロジェクトに見立 てて “ Google SpreadSheet ” で会議を開く “ SNS ” でコミュニケーションを補助する “ Wiki ” で成果物を共有する.
Advertisements

Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
IBMユーザ研究会九州研T3 5章 Webの発展可能性. WWWの発展が企業に与えるもの 顧客・ユーザのリテラシー向上 顧客・ユーザの操作的な ” 常識 ” の変化 システム開発プロジェクトでの応用 ウェブの発展を、企業はどう捉えて、 自らをどう変えていく必要があるか? 新しいプラットフォームをより深く理解することで、
ブログ blog ・ブログとは何 か? ・ブログとは何 か? ・ブログの始め方・ブログの使い方 Copyright Ⓒ 2005 Chiaki Emi All right reserved Ver 1.0.
位置情報履歴を利用した サービス提供機構の構築 慶応大学環境情報学部 4 年 徳田研究室 土田泰徳
「図書管理」のための Webアプリケーション開発 -Apache/Tomcat/MySQL/Java on Windows XP-
北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学
日語会話  .
検索エンジン最適化.
ヘルスケア連動型 市販薬検索システム 研究者 : 加納 えり 指導教員 : 越田 高志.
Twitterの発言に基づくウェブページ推薦システム
Deep learningによる 読唇システム
WordPressの基礎.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
Shelf-Navigator ユーザ動作による書籍相関抽出機構
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
卒論中間発表 WWW検索キーワードナビゲーションシステムの設計と実装
稚内北星学園大学 情報メディア学部 助教授 安藤 友晴
Piggy Bank: Experience the Semantic Web Inside Your Web Browser
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
共同ローカリゼーション フレームワーク 井上 謙次.
12月11日(土) 13:00~15:00 長崎大学教育学部 全炳徳 久方純
あなたのお店をもっと 「ブランディング」して、 あなた自身の時間を作るために 業務を「自動化」しよう!
ユビキタス環境における コミュニケーション・ツール選択支援機構の提案
ストリーム処理エンジンを用いた 顔映像に対する 補助情報提供システム
最終課題 Webアプリケーション 〜ページのしおり機能〜
情報検索演習 第8回 パソコンを起動しておくこと 前から4列目までに着席すること 2005年11月30日 後期 水曜5限
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
GPS搭載携帯電話を用いた 位置情報付きWeblog投稿・検索システムの設計と実装
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
技術参照モデルとシステム要件定義 に関する学習システム
2004年度 サマースクール in 稚内 JavaによるWebアプリケーション入門
2003年度 データベース論 安藤 友晴.
徳田研究室 学部4年 唐津豊 研究への取り組み方、論文の読み方探し方 徳田研究室 学部4年 唐津豊
教育工学を始めよう ~研究テーマの選び方から論文の書き方まで~ (第1章)
東京大学OPAC Plus “言選Web” -関連学術用語による日本語文献情報への 簡易ナビゲーションシステム-
環境リスクマネジメントに関する 検索システム
学生の相互評価を用いた モデリング支援システムの開発
WEBアプリケーションの開発 2002年度春学期 大岩研究会2.
社会シミュレーションのための モデル作成環境
1.Webサイトの情報を活用しよう プレゼンテーション資料
Shimatterシステムの トップダウン分析
物履歴に基づいた ユーザプロファイリング機構の構築
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
予測に用いる数学 2004/05/07 ide.
中京大学 情報理工学部 情報知能学科 H 中畑 淳貴 H 堀田 将克
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
エピソード記憶に訴えるBookmarkless Bookmarkの実現
UPOH: User Profiling based on Object History
2003年度 図書館活用論 Ⅰ 第9講 検索エンジンの仕組みと活用 (明治大学図書館庶務課システム担当 中林)
一方向画像からの 3Dモデル生成 電気電子工学科 白井研究室 T215049 田原 大輝.
プロジェクト演習Ⅱ インタラクティブゲーム制作
実空間における関連本アウェアネス 支援システム
Firebaseを用いた 位置情報共有システム
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
第10回:Microsoft Excel (2/2)
Webからの 人間関係ネットワークの抽出と 情報支援
発表32 レポート評価支援について (剽窃部分と指導箇所の検出)
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
自然言語処理2015 Natural Language Processing 2015
Googleマップを活用した 生物調査データベースの構築
情報検索(4) 検索エンジンを用いた演習 教員 岩村 雅一
Webページタイプによるクラスタ リングを用いた検索支援システム
医療科学B演習のおさらい 杏林大学医学図書館 医療科学B.
自然言語処理2016 Natural Language Processing 2016
ブログアクセスアップの方法  周 嘉鏐
P2Pによる協調学習システム 唐澤 信介   北海道工業大学 電気工学専攻.
Presentation transcript:

複数活動履歴を基にしたユーザの関心情報の抽出 卒業論文中間発表 環境情報学部 鈴木 慧(suzuk)

Outline 背景 問題 目的 アプローチ 関連研究 今後の予定 まとめ

背景 デジタル化 コンピュータ上の作業の普及 デバイスの普及 書類: ドキュメントファイル 連絡: メールボックス 情報源: Web 書類: ドキュメントファイル 連絡: メールボックス 情報源: Web デバイスの普及 デジタルカメラ: 画像ファイル GPS: 位置情報

日々の活動をアーカイブする機会が増加 日々、活動の記録を電子的に保存する その日得た経験を保存 一連の作業プロセスを記録 blogでは、日々の気になった情報、感想、意見など GPSでは一日の生活空間を取得

本研究ではユーザが関心のある情報を関心情報と呼ぶ 後から活動履歴を参照するには 活動履歴の1つ1つは断片的な情報 自分の関心のある情報を抽出して見たい 今自分が関心のある情報を抽出して見られたら便利 ユーザが関心のある情報を取得する必要がある 本研究ではユーザが関心のある情報を関心情報と呼ぶ

問題意識 複数活動履歴を統一的に扱うシステムがない Blog 検索ワード 位置情報のメタ情報 画像ファイル 関心を抱いていること 作業プロセス 役に立った情報へのリン 検索ワード    Google検索で検索した単語 位置情報のメタ情報 位置に関連したメタ情報を取得できることを想定 画像ファイル 取得した位置情報のメタ情報と関連づけられる

目的 複数の活動履歴からユーザの関心情報と合う履歴を抽出する 自分の活動履歴を参照 他人の活動履歴を参照 自分の生活、仕事ぶりを見返す 他人の蓄積された経験を取得 他人が通った作業プロセスを確認 知識の整理 知識の獲得

アプローチ 重み付けされた単語セットとしてユーザの関心情報を表現 活動履歴に関心情報を付加してindexingしておく 変わらない関心単語 固定ユーザプロファイルに書いておく それ以外 活動履歴からユーザの関心情報を抽出 どの活動履歴を優先するか重み付けする 活動履歴に関心情報を付加してindexingしておく 関心情報と合う活動履歴を抽出する際に高速化 現在の自分の位置を結果に反映させる 学校にいる場合、電車に乗ってる場合など

活動履歴からユーザの関心情報を抽出 重み付けされた単語セットのモデルとして表現 Blog 単語セット 位置情報のメタ情報 原宿 1.0 blog内の形態素解析とtfidfによる頻出単語 各単語に重み付け 位置情報のメタ情報 位置にリンクしたデータベースから取得 観光地、お店など Googleで調べる検索ワード 単語セット 原宿 1.0 新宿 1.0 GAP 0.8 イタリア料理 0.6

どの活動履歴を優先するか 検索単語 blog内の頻出単語 位置情報に関連した情報 最近検索されたもの 検索単語、位置情報に関連したもの 頻繁に寄る場所 新規性のある場所

動作モデル図 1つ1つがblog,検索単語、位置情報のメタ情報、画像ファイル 活動履歴 関心情報 A B A A A B A A B time line 関心情報Aのときに活動履歴を参照 抽出された活動履歴 A A A A A A time line

シナリオ1 10年前にはまっていたゲームについて 検索して調べ出す 誰を仲間にすればいい? 自分の10年前の日記履歴 いい思い出だなぁ。。。 対象ゲームに関心があった情報 今日枕元に、FFVが置いてあった。サンタさんは本当にいるんだ!

シナリオ2 渋谷のお店に買い物に行った日 書き込む 重み付けUp 渋谷の A店でBを買った 他人の日記履歴 今後B店に行ってみるか 別のB店のCの方が良かった

システム概要 活動履歴取得Agent 活動履歴 レポジトリ 関心情報算出エンジン 関心情報フィルタ 現在の関心情報 活動履歴保存 活動履歴参照 関心情報算出エンジン 関心情報保存 関心情報フィルタ 更新 参照 現在の関心情報

関連研究 My Life Bits 生活上で取得できるあらゆる電子情報を記録する 取得情報の整理、解析を行っている

今後の予定 8月 実装と調査 9月9日 ユビキタスコンピューティングシステム研究 11月24日 情報処理学会全国大会

まとめと課題 複数活動履歴からユーザの関心情報を抽出 抽出できた関心情報から関心のある活動履歴を抽出する

やるべきこと 興味という単語を別のものに置き換える どれを優先するかのアルゴリズム シナリオを3本 システム概要図 @リーダーを使ってできるシナリオを一本 システム概要図 10年単位で一回変わるくらいなら自分で入力してもよい 分類をリアルワールド的にすればよい 情報フィルタリングについて 「今」乗っている乗り物など「今の状況」を反映させる

やるべきこと 統一的に別種の履歴を扱う、シナリオを言う 関心事を抽出することは確定している

メモ 日記履歴だけを関心情報の抽出に使うのか? 関心情報を使うのは日記履歴だけなのか? Webページのような、まとまった情報を扱うページでは検索エンジンだけでよい blogのようなまとまってない情報を関心事でフィルタする際に有用

メモ 頻出単語から、興味のある「分野」を抽出することは可能なのか? Winnyのクラスタリング Winnyの良いとこ:自主的にクラスタを変えることができる RSSクローラーで同じクラスタの人を見つけてくる 同じクラスタの人がチェックしたアイテムは、本来気になるものでなくとも提示する Webで興味ある情報を参照するのは、見出しとそれに対するコメントが気になったからである みんなの興味対象が一極集中することはいいことか? マニアックな人の意見も反映させたい データを取得してくるAgent データを利用するアプリケーション どのようにデータを保存しておくかが大切

slide repository

ユーザの関心に基づいた 日記データ参照機構の構築 ユーザの関心に基づいた   日記データ参照機構の構築 卒業論文中間発表 環境情報学部 鈴木 慧(suzuk)

機能 履歴の関心事によるカテゴリ分け、フィルタリング 他人の作業プロセスを参照できる 自分と似た嗜好の人物の発見および情報取得 過去履歴の整理 他人の作業プロセスを参照できる 自分と似た嗜好の人物の発見および情報取得

日記履歴の利用 自分の日記履歴 他人の日記履歴 自分の生活、仕事振りを見返す 蓄積された経験を得ることができる 他人が通った作業プロセスを確認できる 知識の整理 知識の獲得

問題 時間が経ち情報が増えると興味のあるものを見つけにくくなる 他人の情報の場合はさらに大変 興味の対象も移り変わる Web blog履歴 検索履歴 blog履歴 Web 検索履歴 blog履歴 Web 検索履歴 blog履歴 位置情報 履歴 位置情報 履歴 位置情報 履歴

シナリオ2 あるサーバ管理者 検索したり、blogに作業内容を書く 書いてある通りにやってもだめだ 他人の日記履歴 ここを変えればいいのか こうしたらよかったぞ 今日もだめだった

日記履歴の取得種類に商品タグを追加すると シナリオ3 物にタグがついた世界 秋葉原のお店Aで 商品のタグを取得する この商品気になるなぁ・・・ タグ取っておくか 日記履歴の取得種類に商品タグを追加すると 黒がでるらしいですよ もう少し待ってみるか

目的 ユーザの興味に基づいてデータをフィルタリングする 同じ興味を持った他者の日記履歴を共有できる場合、他者の経験を獲得できる

保存される興味情報 全体的な興味情報 種別ごと blog 位置情報 検索単語

日記履歴の利用 自分の日記履歴 他人の日記履歴 自分の生活、仕事振りを見返す 蓄積された経験を得ることができる 他人が通った作業プロセスを確認できる 知識の整理 知識の獲得

10年単位で考える 日記履歴の1つ1つは断片的な情報 今自分が関心のある情報を統合して見られたら便利 自分の関心のある情報を統合して見たい ユーザの関心情報を取得する必要がある

問題意識 取得できる日記履歴を統一的に扱うシステムがない

目的 複数日記履歴からユーザの関心情報を抽出し、関心のある日記履歴を統合する

ユーザの関心情報の抽出 重み付けされた単語セットのモデルとして表現 検索単語 blog内の形態素解析とtfidfによる頻出単語 各単語に重み付け 位置情報に関連した情報 位置にリンクしたデータベースから取得 観光地、お店など