Satoru Ishikawa Satoru Satake Denis Vazhenin Software Development Arena Summarizing Tools for General Purpose Search Engines Satoru Ishikawa Satoru Satake Denis Vazhenin Supervised by prof. Vitaly Klyuev
プロジェクトの目的 学術資料としてのインターネットの役割が近年飛躍的に高まってきている。 しかしながら、検索エンジンだけを使用して適切な情報を手に入れるのは決して楽とは言いがたい。 もっと速く適切な情報を手に入れるためには他に新たなソフトウェアが必要!
ソリューション 検索クオリティを向上する一つのソリューションとして次が考えられる; 自動要約メソッドのデザイン, このメソッドと既存のサーチエンジンとの結合, 更にクライアントのコンピューターから直接もしくは、サーバーを介して作動させることができるアプリケーションを作る。 ユーザーがそれぞれのウェブページの要約を受け取ることで、すべてのウェブページに目を通す時間を短縮することが目的。
ユースケースモデル Data collector query document Data processing summary Report generator result
ユースケース ユースケース名 適切なインターネット上の情報の検索 概要 ユーザーがウェブページの要約を受け取る。 事前条件 ユーザーがインターネット上で情報を検索しようとしている. 事後条件 ユーザーは要約を読み、各々のウェブページが適切かどうか判断する必要がある。 基本フロー 1. アプリケーションがクエリをユーザーから受け取る。 2. サーチエンジンにクエリ情報を送り反応を待つ。 3. 検索結果のトップ10のウェブサイトをダウンロード。 4. 要約ツールにより要約の作成。 5. 結果(URLと要約)をユーザーに表示。
ソフトウェアのアルゴリズム
処理の流れ プロトタイプの基本概要 User MakeIndexHtml Summarizer Submit Query 8. Show the Result to the end user User FileDownloader HtmlTagReplace Submit Query 1. input query and press submit button 2. Throw the query to Google 3. Get Top 10 URLs and Files 4.Skip Download if the URL is dead link, error, or downloading time is too long . 5. Replace all Html tag and Java script code Summarizer 6. Make Summaries MakeIndexHtml プロトタイプの基本概要
プロトタイプ
プロトタイプの結果
プロトタイプとGoogleの比較
コンクルージョン Googleを比較対象として前述のソフトウェアのプロトタイプのテストを行った: プロトタイプは、学術論文などの文章に対しては、非常によいパフォーマンスを示した。 しかしながら、Googleの反応速度の方が一般的に速いという結果もまた示された。
学会発表 私たちは国際学会で次の通り発表しました: “A Web Retrieval and Summarizing tool”, The XXXIX Conference on Control Processes and Stability, St. Petersburg, Russia, April 2008 (forthcoming publication). “A Document Retrieval Framework for Scientific Publications “,The IEEE SIBIRCON-2008 , Novosibirsk, Russia, July, 2008 (forthcoming publication). “Managing Emotions: What Japanese Engineering Students Know and what they Need to Know for Effective Team Communication”, The IEEE International Professional Communication Conference 2008, Montreal, Canada, July 2008 (forthcoming publication). “A Summarizer for Document Retrieval on the Web”, International Conference REV 2008, Remote Engineering & Virtual Instrumentation 2008, Dusseldorf, Germany, June 2008 (forthcoming publication).
Thank you for your attention! If you have any questions, please a feel free to ask me.