Web 共同編集機能を実装した メール検索システム 井上研究室 Choy Kho Yee 2006年02月27日.

Slides:



Advertisements
Similar presentations
ウィキについて 1 1040431 1 1040431 植木貴宏 植木貴宏. ウィキとは? ウェブブラウザを利用して Web サーバ 上のハイパーテキスト文書を書き換え るシステムの一種。 ウェブブラウザを利用して Web サーバ 上のハイパーテキスト文書を書き換え るシステムの一種。 Wiki とは、ハワイ語で「速い」を意味.
Advertisements

IBMユーザ研究会九州研T3 3.Web2.0を実際に使ってみた. Web2.0を実際に使ってみました 研究会をプロジェクトに見立 てて “ Google SpreadSheet ” で会議を開く “ SNS ” でコミュニケーションを補助する “ Wiki ” で成果物を共有する.
静岡大学情報学研究科 戸根木千洋 ユーザーイメージ収集 インターフェースの開発. 2 目次 背景と目的 研究の構成 研究の詳細 イメージ収集インターフェースの提案 映画イメージ収集システムの開発 システムの評価 今後の課題.
Copyright (C) 2010 Cybozu, Inc. サイボウズ ガルーン 3 マルチレポー ト 活用支援資料 サイボウズ株式会社.
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 保守支援を目的とした コードクローン情報検索ツール.
学事予算の支出状況表作成に 係る業務の効率化 教学部 高輪教学課 加藤美博. 目 次 ①背景 ②財務情報システムの現状 ③これまでの取り組み ④新たな改善事項 ⑤効果.
Project Next-L プロトタイ プ 東京工科大学 田辺浩介
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
ユーザーイメージ収集 インターフェイスの開発
Microsoft Office 2010 クイックガイド ~OneNote編~
企画書作成ソフトウェアの開発 佐々木研究室 05k1134 吉村祥平.
状況に応じたサービスを 提供するための人や物に 共通の情報管理
最新ファイルの提供を保証する代理FTPサーバの開発
XHTML構文検証手法における スクリプト要素の静的解析アルゴリズム
④CiNii ⑤NDL-OPAC(雑誌記事) ⑥日経BP
WEBから確認できる 駐車場管理システムについて
~ 企業内の情報共有のために~ 暗黙知を→形式知へ キッズウェイナレッジのご提案 2003年7月 24日 - 第1版 -
WebDAVでOpenOffice.org の文章を共有する
OpenOffice.org で版管理 西木 毅 第2回関西OpenOffice.org勉強会 大阪電気通信大学
Digital Network And Communication
ホームページの作り方.
心理学情報処理法Ⅰ やってみよう:Excelを使ってみよう.
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
共同ローカリゼーション フレームワーク 井上 謙次.
大阪教育大学大学院教育学研究科 総合基礎科学専攻 中窪 仁
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
2009/5/22 けーちゃん カンタン  Wikiで情報共有 あいさつ 2009/5/22 けーちゃん
川口真司 松下誠 井上克郎 大阪大学大学院情報科学研究科
Microsoft Office 2010 クイックガイド ~OneNote編~
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
プログラム実行履歴を用いたトランザクションファンクション抽出手法
JIMDO勉強会その2 アカウント新規作成.
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
管理画面操作マニュアル <サイト管理(1)> 基本設定 第9版 改訂 株式会社アクア 1.
ソースコードの変更履歴における メトリクス値の変化を用いた ソフトウェアの特性分析
ソードコードの編集に基づいた コードクローンの分類とその分析システム
Javaソースコード蓄積・ 検索システムSPARS-Jの概要
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
オープンソース開発の履歴情報を用いたコミュニティ検索支援システム
すぐできるBOOK -プロジェクト編-.
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
FUJITSU Security Solution SYNCDOT MailSuite
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
通信機構合わせた最適化をおこなう並列化ンパイラ
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
ソースコードの特徴量を用いた機械学習による メソッド抽出リファクタリング推薦手法
オープンソース開発支援のための リビジョン情報と電子メールの検索システム
情報スキル活用 第2週 基礎技術ー2 : Webページの基本形.
7-0.SWORD Client for WEKO インストールマニュアル Version 2.2
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
エピソード記憶に訴えるBookmarkless Bookmarkの実現
コンピュータ プレゼンテーション.
アスペクト指向言語のための 独立性の高いパッケージシステム
Javaソフトウェア部品検索システムSPARS-Jの実験的評価
Firebaseを用いた 位置情報共有システム
ソフトウェア保守のための コードクローン情報検索ツール
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
複数のリポジトリを統合できる バージョン管理システムの提案と試作
プログラミング演習I 2003年7月2日(第11回) 木村巌.
保守請負時を対象とした 労力見積のためのメトリクスの提案
メソッドの同時更新履歴を用いたクラスの機能別分類法
エイリアス関係を考慮した Javaプログラム用静的スライシングツール
関数の変更履歴と呼び出し関係に 基づいた開発履歴理解支援システム
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
プログラム理解のための 付加注釈 DocumentTag の提案
Presentation transcript:

Web 共同編集機能を実装した メール検索システム 井上研究室 Choy Kho Yee 2006年02月27日

2006/02/27 平成 17 年特別研究報告 2 オープンソース開発とメーリングリ スト オープンソース開発  ソースコードなどが公開される  世界中に分散した開発者が協力し合って開発を行 う メーリングリスト  開発者とユーザ間での意思疎通を果たす 設計と実装やバグ,使い方について議論する

2006/02/27 平成 17 年特別研究報告 3 メーリングリストアーカイブ メーリングリ ストでやりと り 疑問を持った開発者・ユー ザ メーリングリ ストアーカイ ブ 検索 全てのメールを メーリングリスト アーカイブに保存 開発者・ユーザは過去の 議論を参考にして、 問題を解決するために 頻繁にアーカイブを検索する

2006/02/27 平成 17 年特別研究報告 4 メーリングリストアーカイブの問題 点 時間の流れ 1. ユーザ A はメールを出した 2. メールの内容が時間が過ぎると正確でなくなった 3. ユーザ B がそのメールを見て,間違った情報を信じてしまった 4. ユーザ B は間違った判断をしてしまった 5. 場合によって,検索しなおす ユーザ A ユーザ B あるイベントで メールの内容が 正確でなくなった

2006/02/27 平成 17 年特別研究報告 5 Web 共同編集作業 例:フリー百科事典「 Wikipedia 」  各項目は利用者が保守します  間違った箇所は誰でもすぐに修正できる Web を通して利用者が共同に文章の編 集,レビューを行う作業 メーリングリストアーカイブの問題点 の解消に利用できる

2006/02/27 平成 17 年特別研究報告 6 本研究の目的 メーリングリストアーカイブの利用者に 正確な情報を効率よく届ける 課題  メールの内容の品質向上  メールの本文以外の情報の提供  検索効率の向上

2006/02/27 平成 17 年特別研究報告 7 メールの内容の品質改善  メールの編集 メール本文以外の情報の提供  メールに対するコメント追加  メールに対する評価  メールのタグでの分類 検索効率の向上  評価,タグの検索への反映 提案手法 Web 共同編集機能を実装したメー ル検索システムを提案

2006/02/27 平成 17 年特別研究報告 8 メールの編集 Wiki を導入  Wiki とは, Web インターフェイスからサーバ上 の テキスト文書を簡単に書き換えるシステム 編集履歴を管理  一回の編集につきバージョンが1つ増加する 過去の内容を参照して編集を行う 悪質な書き込みからの内容を復帰する

2006/02/27 平成 17 年特別研究報告 9 メール本文以外の情報提供 コメント  メールに対する意見・補足である  一通のメールに対して複数のコメントを追加できる ランク  ユーザのメールに対した評価を表す  ランクの範囲は “-10” ~ “+10” である  複数のユーザが付けたランクの平均値をとる タグ  ユーザが任意に指定できる文字列である 例: ”windows migrate”, “php setup” など  複数指定可能  メールの分類に利用される

2006/02/27 平成 17 年特別研究報告 10 メーリングリストアーカイブのモデ ル図 実体 属性 関連 スレッド構造の 再現に利用した

2006/02/27 平成 17 年特別研究報告 11 スレッド トップ スレッド メール1 メール2 メール3 検索機能 MySQL の全文検索機能を利用する  メールの最初のバージョンと最新バージョンのみ スレッド単位で出力する メール2がヒットすればスレッド全体がヒットする スレッド全体のスコアは各メールのスコアの合計

2006/02/27 平成 17 年特別研究報告 12 スコアの計算 メールのスコア, X は下記式で算出 S my : MySQL の内部スコア R: メールのランク N title : メールのタイトルに含まれる検索キーワード の数 N tag : 検索キーワードに一致したメールのタグの数 ※検索にヒットしなかったメールのスコア=0

2006/02/27 平成 17 年特別研究報告 13 検索の高速化 スレッドトップを求めるのに時間がかか る  メール⇔スレッドトップの関係を予め保持して おく 同じキーワードで毎回検索すると効率が 悪い  検索キャッシュを設けた キャッシュの有効期限は 10 分間にした

2006/02/27 平成 17 年特別研究報告 14 MLwiki の概略図 登録プログラム  Perl で実装  576 行 データベース  MySQL  16 個のテーブル Web インターフェ イス  PHP で実装  9 つのファイル  総行数 2265 行

2006/02/27 平成 17 年特別研究報告 15 MLwiki のユーザインターフェイス ナビゲーション・サイドバー 検索結果・内容などの表示部 検索入力部

2006/02/27 平成 17 年特別研究報告 16 メールの編集 メールの内容 編集部 無効なリンク 古い情報 最新情報を書く 追加された部分

2006/02/27 平成 17 年特別研究報告 17 実験 目的  検索精度を確認する  今後の研究の方向を確認する 対象  FreeBSD のメーリングリストアーカイブ 方法  既存全文検索システム Namazu と比較  FreeBSD の開発者にアンケート採取

2006/02/27 平成 17 年特別研究報告 18 Namazu との比較 設定  freebsd-stable で 2005 年 12 月にやりとりされた メールの中から「デバイスドライバーに関する 議論」を探したい 方法  5 つのキーワードで検索を 5 回行った キーワード: device driver, device support, driver, driver problem, driver support  再現率,適合率の平均値を求め,f値を計算

2006/02/27 平成 17 年特別研究報告 19 Namazu との比較結果 %46.5% 本システム %45.0%Namazu f値f値適合率再現率 既存全文検索システム Namazu との比較結果 再現率 - 必要な情報のうち実際に検索された情報の割合 適合率 - 実際に検索された情報のうち必要な情報の割合 ランク,タグの数の増加とともに検索精度の 向上が期待できる

2006/02/27 平成 17 年特別研究報告 20 アンケートの結果 FreeBSD の開発者にアンケート採取  期間: 3 週間( 2006 年 1 月 20 日~ 2 月 10 日)  設問数: 17 問  回収できた件数: 14 件 本システムにおいて実用だと思われる機能 人数

2006/02/27 平成 17 年特別研究報告 21 まとめと課題 Web 共同編集機能を実装したメール検索システ ムの設計と実装を行った Namazu と比較した結果,本システムの検索精 度が高いとわかった アンケートを通して今後の研究の方向を確認し た メール編集に対する抵抗感の解消方法の考案  編集されたことをより強調するなど より長い期間でシステムを公開し有効性の検証

終わり ご清聴ありがとうございました

2006/02/27 平成 17 年特別研究報告 23 まとめと課題 Web 共同編集機能を実装したメール検索システ ムの設計と実装を行った Namazu と比較した結果,本システムの検索精 度が高いとわかった アンケートを通して今後の研究の方向を確認し た メール編集に対する抵抗感の解消方法の考案  編集されたことをより強調するなど より長い期間でシステムを公開し有効性の検証

背景

2006/02/27 平成 17 年特別研究報告 25 Wiki とは Web インターフェイスからサーバ上の ハイパーテキスト文書を簡単に書き換え る システム 特徴:  どこからでも、いつでも、誰でも、文書を書き 換えて保存することができる  特有の文書マークアップが使える  文書間のリンクが張りやすい

2006/02/27 平成 17 年特別研究報告 26 Wiki のマークアップ例

設計と実装

2006/02/27 平成 17 年特別研究報告 28 メーリングリストのモデル図(1)

2006/02/27 平成 17 年特別研究報告 29 メーリングリストのモデル図(2)

2006/02/27 平成 17 年特別研究報告 30 メーリングリストのモデル図(3)

2006/02/27 平成 17 年特別研究報告 31 データベースのスキーマ

2006/02/27 平成 17 年特別研究報告 32 MLwiki の対象、動作環境 対象としたメーリングリストアーカイブ  FreeBSD のメーリングリストアーカイブ 動作環境  CPU: Pentium GHz  メモリ: 884 MB RAM  OS: Debian Sarge  Apache  MySQL  PHP  Perl  その他: CPAN のライブラリ、 PHP Pear のパッケージ

動作例

2006/02/27 平成 17 年特別研究報告 34 Wiki の作成 キャメルケース( CamelCase )による Wiki リンクの作成 疑問号をクリックする Wiki のマークアップを 用いて文章を作成する 最近作成された Wiki の一覧表示

2006/02/27 平成 17 年特別研究報告 35 コメントの追加 コメントが追加された

2006/02/27 平成 17 年特別研究報告 36 ランクを用いた評価

2006/02/27 平成 17 年特別研究報告 37 タグを利用したメールの分類 メールの内容表示 編集部 タグの表示 → “screen capture” で タグ付けられたメール タグのリスト

2006/02/27 平成 17 年特別研究報告 38 ナビゲーション・サイドバー

2006/02/27 平成 17 年特別研究報告 39 実例:迷惑メール

評価・その他

2006/02/27 平成 17 年特別研究報告 41 データベースの作成時間 検索インデックスの 作成時間=1時間17分

2006/02/27 平成 17 年特別研究報告 42 検索効率の評価

2006/02/27 平成 17 年特別研究報告 43 再現率 (Recall) ,適合率 (Precision)