DynC 要素技術 Progressive User Profiling(PUP)

Slides:



Advertisements
Similar presentations
1 実技演習1 2008/01/28,29 JaLTER Morpho 講習会. 2 起動・接続 各自、コンピュータを起動してネットワーク に接続してください。 各自、コンピュータを起動してネットワーク に接続してください。 IP アドレス自動取得 IP アドレス自動取得 無線 LAN 使用可 無線.
Advertisements

協調フィルタリングに基づく ソフトウェア開発技術の推薦 ソフトウェアサイエンス研究会@信州大学 2005 年 6 月 23 日 奈良先端科学技術大学院大学 情報科学研究科 秋永 知宏,大杉 直樹,柿元 健,角田 雅照, 門田 暁人,松本 健一.
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
情報処理 A 第 5 回かな? ワードの使い方. 拡張子  ファイルの名前は, “ ファイル名. 拡張子 ” で付け る.  拡張子は,そのファイルを読み込むソフトに影 響される –txt テキストファイル –doc ワードのファイル –xls エクセルのファイル –pdf Acrobat Reader.
データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
嗜好ベクトルの近似による サービス享受条件の自動設定 立命館大学大学院 理工学研究科 データ工学研究室 ◎川成宗剛,山原裕之, 原田史子, 島川博光 2007 年 9 月 6 日.
Internet Explorer v7,v8 の主な機能
Microsoft Office 2010 クイックガイド ~OneNote編~
初めてのEndNote はじめに EndNoteの使い方 EndNoteとは EndNoteでできること 起動とライブラリの作成
Microsoft Office クイックガイド ~Excel 2013~
応用コース:ワープロを活用する WORD2000 1回目 基礎コースの復習(第1章と付録) 2回目 文字の入力(第2章と第4章)
4.ユーザー登録マニュアル              Version 年6月10日 国立情報学研究所.
大杉 直樹†, 神谷 年洋‡, 門田 暁人†, 松本 健一† †奈良先端科学技術大学院大学 情報工学科 {naoki-o, akito-m,
ブラウザの基本操作 前のページに戻る ブラウザの左上にある 「戻る」ボタンで、自分がたどってきた一つ前のページに戻ることができます。
情報処理 第8回.
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
情報処理 第7回.
[グループ名]向けウェブナー [所属機関名] [日付] [発表者の氏名] [発表者の敬称/肩書]
情報処理基礎 2006年 6月 1日.
デジタルポートフォリオ作成支援ツール PictFolio 使用マニュアル
英語勉強会.
SharePoint Server において 構成ウィザードが失敗する場合の トラブルシューティング
2007 Microsoft Office system クイックガイド
Microsoft Office InfoPath 2003 概要
IM、プレゼンス、連絡先 IM 要求に応答する プレゼンスを設定または変更する ユーザーを検索する
コンピュータ演習Ⅰ 8月7日(日) 1限目 ファイルの種類.
卒業論文のタイトルをここに (発表時間は5分です。 PPTスライドは10枚程度にまとめる事)
夢見る図書館情報システム The Cards Challenge !
Microsoft Office 2010 クイックガイド ~ファイルの互換性編~
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
チュートリアル EBSCOhost での記事の閲覧 support.ebsco.com.
文献管理ソフトRefWorksの利用.
Full Text Finder Publication Finder の概要
9 Microsoft Word(1).
チュートリアル EBSCOhostの概要
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
Progressive User Profiling in Recommendation Systems
パスファインダーの作成 slis. tsukuba. ac. jp/~fuyuki/cje2/CJE161018
Microsoft Office 2010 クイックガイド ~OneNote編~
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
Air Pen -- an introduction of my recent result --
三浦欽也 2009年11月 〔Sc182(2) 情報科学演習 参考資料〕
10 Microsoft Word(1) 10.1 Microsoft Word v.Xの概要 起動 終了
情報処理技法(リテラシ)I 第10回:Excel (1/2)
CINAHL データベース チュートリアル 基本検索 featuring:
Office IME 2010 を使う.
ウイルスについて I98N044 久野耕介 I98N114 藤田和久
コードクローンに含まれるメソッド呼び出しの 変更度合の分析
コードクローンに含まれるメソッド呼び出しの 変更度合の調査
資料1-6 平成26年度 第1回技術委員会資料 支援ツール群整備方針
環境リスクマネジメントに関する 検索システム
PowerPoint へようこそ 簡単に操作するための 5 つのヒント.
3.1 PowerPoint の概要 PowerPointを使ってできること
Satoru Ishikawa Satoru Satake Denis Vazhenin
コンピュータ プレゼンテーション.
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
エピソード記憶に訴えるBookmarkless Bookmarkの実現
コンピュータと情報 第4回 ワードの使い方.
実空間における関連本アウェアネス 支援システム
構造的類似性を持つ半構造化文書における頻度分析
プログラムスライスを用いた凝集度メトリクスに基づく 類似メソッド集約候補の順位付け手法
常設チャット トピック フィードを作成してアクティビティをフォローする Lync 2013 クイック リファレンス
自然言語処理2015 Natural Language Processing 2015
Microsoft Office 2010 クイックガイド ~ファイルの互換性編~
自然言語処理2016 Natural Language Processing 2016
識別子の読解を目的とした名詞辞書の作成方法の一試案
Presentation transcript:

DynC 要素技術 Progressive User Profiling(PUP) Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. DynC 要素技術 Progressive User Profiling(PUP) Thank you very much for introducing me, Professor Nakakoji. And thank you for all audiences and this occasion to make presentation in this workshop. I'd like to talk about my research of "A Recommendation System for Software Function Discovery". Actually, I'm studying in a software engineering laboratory. But, this research is computer-human-interaction related thing rather than software engineering. Fortunately, here are many researchers who are the specialists of computer-human interaction. So, I would appreciate if you make advices and comments for my research. 大杉 直樹,松本 健一 情報科学研究科 奈良先端科学技術大学院大学 2004年2月13日(金)函館 DynC プロジェクトミーティング International Workshop on Community-Driven Evolution of Knowledge Artifacts

ユーザは機能を使いこなしていない 被験者: 32人(NAISTの学生,教員) 期間: 約22 ヵ月 ソフトウェアの全機能数 Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. ユーザは機能を使いこなしていない 被験者: 32人(NAISTの学生,教員) 期間: 約22 ヵ月 ソフトウェアの全機能数 一人のユーザが使用した最大機能数 一人のユーザが使用した最小機能数 一人のユーザの平均使用機能数 機能数 792 800 772 705 ユーザが実際にどれぐらいの数の機能を使用しているのか, 32人の学生,並びに,教員のみなさんに御協力いただき,1ヵ月から22ヵ月に渡って調査を行いました. オレンジ色のグラフはソフトウェアの全機能数,緑色のグラフは熟練者の使用機能数,ピンク色のグラフは初心者の使用機能数,そして,水色のグラフは32人のユーザの平均使用機能数です.ここでは,最も多くの機能を使用しているユーザを熟練者,最も少ない機能しか使用していないユーザを初心者と呼んでいます. 調査結果を示したグラフがこれです.グラフから分かるように,熟練者でさえ全機能の約 10% から 30% の機能しか使用していません.平均的なユーザは約 3% から 15% 程度の機能しかおらず,初心者に至っては 5% 未満の機能しか使用していません. 調査の結果から,ユーザはソフトウェアのごく一部の機能しか使用していないことが分かります.その原因として,有用な機能を探すのが難しい,或いは,ソフトウェアに有用な機能があっても,その存在に気付いていないこと考えられます. 700 660 646 600 565 10.6% 10.5% 33.5% 22.8% 21.7% 15.5% 500 1.4% 1.5% 3.2% 4.8% 3.3% 400 5.4% 3.3% 14.2% 10.4% 10.0% 4.1% 300 189 200 147 143 120 75 83 80 100 67 66 38 26 31 32 10 12 18 22 11 International Workshop on Community-Driven Evolution of Knowledge Artifacts Excel2000 Excel2002 PPT2000 PPT2002 Word2000 Word2002

ソフトウェア機能推薦システムの画面イメージ Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. ソフトウェア機能推薦システム 個々のユーザにとって有用だと思われる機能を,有用さの程度を表す得点と共に表示する 「有用な機能を探しにくい」,「有用な機能の存在に気付かない」という問題を解決する 私は,有用な機能を探しにくい,或いは,有用な機能の存在に気付かない,という問題を解決するため「ソフトウェア機能推薦システム」について研究しました. これは研究したシステムの画面イメージです.システムは,個々のユーザにとって有用だと思われる機能を,有用さの程度を表す得点と共に表示します. おすすめの機能があります! ツール(T)  文字カウント(W)… 82 点 挿入(I)  日付と時刻(T)… 63 点 ツール(T)  類義語辞典(T)… 42 点 挿入  脚注(N)… 32 点 ツール  文書校正(S)… 30 点 ソフトウェア機能推薦システムの画面イメージ International Workshop on Community-Driven Evolution of Knowledge Artifacts

協調フィルタリングとは? 協調:複数のユーザのプロファイル(好みの傾向)を参考にして… Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. 協調フィルタリングとは? 協調:複数のユーザのプロファイル(好みの傾向)を参考にして… フィルタリング:大量のアイテムから有用なアイテムを選び出す 有用なアイテムを選び出す 収集された機能実行履歴に対して協調フィルタリングを行います.次は協調フィルタリングについて説明します. 協調フィルタリングは,多数のアイテムの中から有用なアイテムを選び出す情報フィルタリングの一手法です.フィルタリングを行う際に複数のユーザの知識を利用することが特徴です.「協調」と「フィルタリング」という2つの単語はこの特徴を表しています. この図では定義を一般化するため,協調フィルタリングの対象となるものをアイテムと呼んでいます.A, B, C, … と名前が付けられた多数のアイテムから,3人のユーザの知識を利用して情報 F と K が選び出されたことを示しています. A B C D E F はイイ! K は最高! F K F G H I J K L M N O P Q R S T International Workshop on Community-Driven Evolution of Knowledge Artifacts 複数のユーザのプロファイルを参考にする 大量のアイテム

Amazon.com(書籍推薦システム) プロファイルの収集:各ユーザから本に対する5段階の評価(5:良い~1:悪い)を収集する Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. Amazon.com(書籍推薦システム) プロファイルの収集:各ユーザから本に対する5段階の評価(5:良い~1:悪い)を収集する フィルタリング:収集した評価に基づいて,個々のユーザにとって好ましいと思われる本を選び出す Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P., and Riedl, J. (1994). GroupLens: An Open Architecture for Collaborative Filtering of Netnews. In Proc. of CSCW ’94. 関連研究について紹介します. ソフトウェアの有用な機能や,操作方法のヘルプを検索し,表示するシステムとして,Microsoft 社の Office に同梱されています Office アシスタントというものがあります.このシステムはまず,ユーザが実行した機能の履歴を収集します.収集した履歴にベイジアン・ユーザ・モデリングを行い,ユーザにとって有用だと思われる操作説明文を予測します. また,ユーザに本を推薦するシステムとして オンラインブックストアの Amazon.com の本推薦システムがあります.このシステムはまず,ユーザに本を5段階で評価してもらいます.そして収集した評価に基づいて協調フィルタリングを行い,ユーザにとって好ましいと思われる本を予測します. 本研究では,これらのシステムを参考に,ソフトウェアの機能を推薦するシステムの実現方法を考察しました. International Workshop on Community-Driven Evolution of Knowledge Artifacts

提案システムにおけるプロファイルの収集 ユーザが作業中に実行した機能の履歴(機能実行履歴 )を,インターネットを介して収集する Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. 提案システムにおけるプロファイルの収集 ユーザが作業中に実行した機能の履歴(機能実行履歴 )を,インターネットを介して収集する 対象ソフトウェア e.g. MS-Word, Excel 【機能実行履歴】 2002/02/20 15:20:41 書式->フォント 2002/02/20 15:24:45 ファイル->上書き保存2003/02/20 15:30:41 挿入->脚注 2003/02/20 15:33:15 書式->フォント 2003/02/20 15:34:46 挿入->日付と時刻 2003/02/20 15:35:22 ファイル->上書き保存 本システムでは,ユーザが作業中に実行した機能の履歴,これを,以降では機能実行履歴と呼びます.機能実行履歴を履歴収集プラグインによって自動的に収集します.そして,インターネットを介してサーバに機能実行履歴を蓄積します. この図は,システムの概要を示した図です.この人形の図が各ユーザを表しており,四角が各ユーザが使用しているコンピュータを表しています.各ユーザのコンピュータには,機能を推薦する対象のソフトウェア,例えば,MS-WordやExcelなど,がインストールされています. システムを利用するユーザは,コンピュータに履歴収集プラグインをインストールしておきます.履歴収集プラグインはユーザが実行した機能を自動的に収集し,サーバに送信します.送信される履歴はこのような形式をしています. どのユーザが,いつ,どんな機能を使用したか,具体的には,ユーザがクリックしたメニュー項目,並びに,ボタンの名前が含まれています. ユーザ インターネット サーバ 履歴収集プラグイン International Workshop on Community-Driven Evolution of Knowledge Artifacts

提案システムにおけるフィルタリング ユーザ間の類似度を求める 類似度の高いユーザが高頻度で実行した機能を推薦する 非類似ユーザ 類似ユーザ Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. 提案システムにおけるフィルタリング ユーザ間の類似度を求める 類似度の高いユーザが高頻度で実行した機能を推薦する 非類似ユーザ 類似ユーザ 機能 A 機能 B 機能 C 機能 D 機能 A 機能 B 機能 C 機能 D 機能 A 機能 B 機能 C 機能 D 機能 A 機能 B 機能 C 機能 D 機能 A 機能 B 機能 C 機能 D 機能 E 機能 F 機能 G 機能 H 機能 I 機能 J 機能 K 機能 B このアルゴリズムでは,まずユーザの機能実行履歴を調べ,推薦対象のユーザuaと,その他のユーザの類似度を調べます. 例えば,ここに5人のユーザがいるとし,それぞれの機能実行履歴がこのようになっているとします.この場合ですと,彼ら全員が機能Aと機能Cを使っており,類似しているユーザであることが分かりました.一方,こちらの2人は使っている機能も全然違い,類似していないユーザであることが分かりました. 類似度計算が終わると,類似度が高い他のユーザが,高い頻度で実行している機能をユーザuaに推薦します.この例では,ユーザuaが使用していない機能Bと機能Dが推薦されます. このアルゴリズムでは,類似度の求め方が非常に重要になってきます. 機能 D ユーザ u1 ユーザua ユーザ u2 ユーザ u3 ユーザ u4 International Workshop on Community-Driven Evolution of Knowledge Artifacts

Blog からの URL 抽出と 協調フィルタリングに基づく Web ページ推薦システム Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. Blog からの URL 抽出と 協調フィルタリングに基づく Web ページ推薦システム Thank you very much for introducing me, Professor Nakakoji. And thank you for all audiences and this occasion to make presentation in this workshop. I'd like to talk about my research of "A Recommendation System for Software Function Discovery". Actually, I'm studying in a software engineering laboratory. But, this research is computer-human-interaction related thing rather than software engineering. Fortunately, here are many researchers who are the specialists of computer-human interaction. So, I would appreciate if you make advices and comments for my research. 大杉 直樹,松本 健一 情報科学研究科 奈良先端科学技術大学院大学 2004年2月13日(金)函館DynCプロジェクトミーティング International Workshop on Community-Driven Evolution of Knowledge Artifacts

面白い web ページを見つける方法 検索エンジンを使う 心の赴くままにブラウンジング ユーザが適切なキーワードを入力しなければ見つからない 運が悪ければ見つからない 面白い web ページはどれ?

Web ページ推薦システム ユーザが面白いと思うであろう web ページを,面白さの程度を表す得点と共に表示する Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. Web ページ推薦システム ユーザが面白いと思うであろう web ページを,面白さの程度を表す得点と共に表示する 「面白い web ページを探しにくい」,「面白い web ページの存在に気付かない」という問題を解決する 私は,有用な機能を探しにくい,或いは,有用な機能の存在に気付かない,という問題を解決するため「ソフトウェア機能推薦システム」について研究しました. これは研究したシステムの画面イメージです.システムは,個々のユーザにとって有用だと思われる機能を,有用さの程度を表す得点と共に表示します. おすすめの web ページがあります! Resignation and Postmortem 82 点 Slashdot: Red Hat CEO Matth... 63 点 Cannot find Weapons of Mass... 42 点 All your base are belong to us... 32 点 Star_Wars_Kid_Remix.wmv 30 点 Web ページ推薦システムの画面イメージ International Workshop on Community-Driven Evolution of Knowledge Artifacts

システム実現のための課題 どのようにして “プロファイルの収集” を行うか どのようにして “フィルタリング” を行うか Blog(weblog,web日記)作成者が紹介した web ページを抽出する どのようにして “フィルタリング” を行うか User-based 協調フィルタリング 「あなたと似た興味を持っている○○さんは,こんな web ページも見ています」 Item-based 協調フィルタリング 「この web ページを見ているユーザは,こんな web ページも見ています」

Blog からプロファイルを収集する Blogの例(たまにっき: http://oikaze.com/~tamada/Diary/ ) サイト内 キーワード 検索ボックス 過去の記事へのリンク アクセス統計 2004年 2月12日 の日記

Blog 作成者が紹介した webページを抽出する プロファイル として抽出する

「たまにっき」から抽出された web ページ Blog 作成者の好みの傾向を表している オープンソースの光と影(www.tahoo.org) 論文の著者は引用文献を本当に読んでいるか?(slashdot.jp) 英語で数学・物理(english-cafe.net) オンドゥル語変換CGI(flexfrank.net) オンドゥル語講座(asame.web.infoseek.co.jp) オンドゥルルラギッタンディスカー!! のガイドライン 4ウェイ!(that.2ch.net) サーバ管理者、経営者に朗報! 安価で安全な新方法論 サイバーノーガード戦法(www.netsecurity.ne.jp) 情報ネットワーク研究会(www.ieice.org) IASTED SE 2004(www.iasted.org) ネットでの儀礼的無関心の可能性(d.hatena.ne.jp)

抽出した web ページをフィルタリング ユーザ間の類似度を求める 類似度の高いユーザが紹介した web ページを推薦する 非類似ユーザ Naoki Ohsugi, "A Recommendation System for Software Function Discovery" Tuesday 16 December, 2003. 抽出した web ページをフィルタリング ユーザ間の類似度を求める 類似度の高いユーザが紹介した web ページを推薦する 非類似ユーザ 類似ユーザ ページA ページB ページC ページD ページA ページB ページC 機能 D ページA ページB ページC ページD ページA ページB ページC ページD ページA ページB ページC ページD ページE ページF ページG ページH ページI ページJ ページK ページB このアルゴリズムでは,まずユーザの機能実行履歴を調べ,推薦対象のユーザuaと,その他のユーザの類似度を調べます. 例えば,ここに5人のユーザがいるとし,それぞれの機能実行履歴がこのようになっているとします.この場合ですと,彼ら全員が機能Aと機能Cを使っており,類似しているユーザであることが分かりました.一方,こちらの2人は使っている機能も全然違い,類似していないユーザであることが分かりました. 類似度計算が終わると,類似度が高い他のユーザが,高い頻度で実行している機能をユーザuaに推薦します.この例では,ユーザuaが使用していない機能Bと機能Dが推薦されます. このアルゴリズムでは,類似度の求め方が非常に重要になってきます. ページD ユーザ u1 ユーザua ユーザ u2 ユーザ u3 ユーザ u4 International Workshop on Community-Driven Evolution of Knowledge Artifacts

考察:システム実現に対するプラス要因 一般ユーザにBlogが浸透し始めている RSS(RDF Site Summary)が浸透し始めている プロバイダ等によるホスティングサービス Blogger: http://www.blogger.com/ ココログ: http://www.cocolog-nifty.com/ Blog サイト構築ツール Movable Type: http://www.movabletype.org/ Puki Wiki: http://pukiwiki.org/ RSS(RDF Site Summary)が浸透し始めている サイトの概要を簡潔に記述するための XML フォーマット Blog の記事(の URL )が自動的にリストアップされる

Blog の記事(のURL)がリストアップされる RSS の例(「たまにっき」のRSS) <items> <rdf:Seq> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-12-4"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-12-3"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-12-2"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-12-1"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-11-3"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-11-2"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-11-1"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-10-3"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-10-2"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-10-1"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-09-101"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-09-1"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-08-202"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-08-201"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-08-101"/> <rdf:li resource="http://www.oikaze.com/~tamada/Diary//2004-02.html#2004-02-08-1"/> </rdf:Seq> </items> クリックすると

まとめ ソフトウェアの機能推薦システム Web ページ推薦システム プロファイル=機能実行履歴 フィルタリング=似たユーザが実行した機能を推薦する Web ページ推薦システム プロファイル=Blog から抽出した web ページ フィルタリング=似たユーザが紹介した web ページを推薦する