情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優

Slides:



Advertisements
Similar presentations
データベースと情報検索 情報検索(2) メディア検索エンジンを使っ てみる 岩村 雅一. 日程(情報検索:担当 岩村)  12/9 検索エンジンを使ってみる  12/16 メディア検索を使ってみる  12/25 ウェブアプリケーションを 使ってみる  1/9 検索エンジンを用いた演習  1/20.
Advertisements

11 月 17 日 インターネット検索の基礎 インターネット検索 最近の話題 宿題披露 興味を持っているものを検索してみ よう どんな時にインターネット検索するか 宿題 授業資料
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
Google フォームの利用法 出欠確認表の運用実例. Google フォームとは Google に登録すると使える機能の一つ「 Google ドライブ」 インターネット上にファイル等を保存出来るスペース、 その中の機能の一つです。 問い合わせやアンケートなどを自由に作れる。 ● アンケートはテンプレートから手軽に出来る.
1 なんとなく Ajax ~新しくて古い XMLHttp 川合孝典 (Kansai.pm) 2005/5/22.
Microsoft Office 2010 クイックガイド ~OneNote編~
初めてのEndNote はじめに EndNoteの使い方 EndNoteとは EndNoteでできること 起動とライブラリの作成
ウェブの時空間解析技術 東京大学生産技術研究所 戦略情報融合国際研究センター 成果概要 ウェブアーカイブ ウェブ空間解析 ウェブ時系列解析
ヘルスケア連動型 市販薬検索システム 研究者 : 加納 えり 指導教員 : 越田 高志.
Flashプレイヤーを使った動画配信 情報工学科 宮本 崇也.
[グループ名]向けウェブナー [所属機関名] [日付] [発表者の氏名] [発表者の敬称/肩書]
join NASS ~つながりあうネットワーク監視システム~
Twitterの発言に基づくウェブページ推薦システム
第2章 ネットサービスとその仕組み(前編) [近代科学社刊]
デジタルポートフォリオ作成支援ツール PictFolio 使用マニュアル
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
フォークソノミー(folksonomy)
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
SlothLib.Web.
早稲田大学大学院理工学研究科 情報科学専攻修士2年 後藤滋樹研究室 坂本義裕
テキストマイニング, データマイニングと 社会活動のトレース
検索エンジンに関して The Anatomy of a Large-Scale Hypertextual Web Search Engine
情報爆発に対応する 新IT基盤研究支援プラットフォームの構築
Multi Search System wwwアプリケーション最終課題 Fri. <7班>
リンク構造を考慮したベクトル空間法によるWebグラフ分割手法に関する研究
平成19年5月19日 第3版 東京大学理学部生物化学図書室 前田 朗
情報コミュニケーション入門 2016年度版 情報コミュニケーション入門m 総合実習(1).
アプリケーション共有機能 〈参考〉 (図1) (図2)
DixChange プロジェクト ~辞書共通化の試み~
テキストの類似度計算
一歩進んだインターネットの利用 ~Firefox と qwikWeb~
Webを使ったナレッジマネジメントとビジネス展開*
WebGIS自動生成システムの 現状と今後の可能性
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
サイト運営者へむけて、CMS管理画面をつかって サイト運営していく方法を紹介します。
PDF管理Webアプリケーションの制作 ~PDFファイル探索時間の短縮化~
日本語解析済みコーパス管理ツール 「茶器」
基礎プログラミング演習 第1回.
Microsoft Office 2010 クイックガイド ~OneNote編~
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
(ご参考)各種SNSをSHIFTに連携させる方法 「facebook」「YouTube」「Instagram」「Twitter」
平成22年6月15日 図書系職員のための アプリケーション開発講習会
ふるみ~る 1DS05178S 山下 大二 1DS05179Y 江藤 隆 1DS05183M 川上 泰生 1DS05200R 橋元 史記
東京大学OPAC Plus “言選Web” -関連学術用語による日本語文献情報への 簡易ナビゲーションシステム-
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
コードクローン検出ツールを用いた ソースコード分析システムの試作と プログラミング演習への適用
クイックガイド <キーワードによる検索方法>
三軸加速度センサを用いた インターフェース設計
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
COM コンポーネント・オブジェクト・モデル.
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
エコマップ班 総合政策学部2年 飯塚直 2005年1月13日 厳網林研究会
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
エピソード記憶に訴えるBookmarkless Bookmarkの実現
テキストマイニング, データマイニングと 社会活動のトレース
Javaソフトウェア部品検索システムSPARS-Jの実験的評価
Firebaseを用いた 位置情報共有システム
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
コーディングパターンの あいまい検索の提案と実装
構造的類似性を持つ半構造化文書における頻度分析
発表32 レポート評価支援について (剽窃部分と指導箇所の検出)
地域生活支援システムの開発 越田研究室 j0431 野津洋二.
大規模コーパスに基づく同義語・多義語処理
Microsoft SharePoint Online の Web サイトを カスタマイズする方法
自然言語処理2015 Natural Language Processing 2015
第2回 Webサーバ.
Webページタイプによるクラスタ リングを用いた検索支援システム
自然言語処理2016 Natural Language Processing 2016
Presentation transcript:

情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優 SlothLib: Web検索研究支援 プログラミングライブラリ http://www.dl.kuis.kyoto-u.ac.jp/slothlib/ 情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優

SlothLibの目的 Web関係,特にWeb検索に関する研究におけるプロトタイプシステムの実装支援 既存アルゴリズムやツール 研究者間での技術の共有が容易になる 視覚的プログラミング環境による直感性向上 アイディアを手軽に形にしてテストできる 議論しながらのプログラミングが可能 新人向けの教育用途としての利用も可能 目指すところ 新しいWeb検索サービスの開発や研究を, 部品を組み替えるように実現する

次世代Web検索のためのライブラリ Web関連の研究における敷居の高さ 新しいアイディアを思いついても,研究に取り掛かる際に膨大な調査,学習,実装時間が必要 Web検索エンジンの利用方法(Google,Yahooなど) ウェブページの取得方法,リンクの取得方法 形態素解析,代表語抽出,クラスタリングなど 各研究者は独自に各種システム・サービスを使うための調査,開発を行っている 情報の共有がほとんど行われていない 独自のコードを組んでいるため再利用が困難 前 準 備 研 究 の 本 番 着想 必要なシステム サービスの調査 プログラミング 言語の習得 各種サービスを 利用するための実装 開発 検証・改良 評価・論文化

ライブラリ化の現状 SlothLib 近い将来,Javaでも実装予定 Web関連のソフトウェアを構成する各種機能を実現 各種機能・既存アルゴリズムを共通インターフェースを持たせる ソフトウェアの試作開発・改良におけるコストを大幅に削減 C#による実装で.Net環境に対応 近い将来,Javaでも実装予定 各ソフトウェア部品が密に連携 類似機能には共通インターフェース グラフ表示 ・ノードとエッジで表現(beta) 各種文書読み込み ・WordやPDF文書の読込 クラスタリング ・階層型:4種 SlothLib Web情報収集 ・マルチスレッドで取得 ・文字コード自動判別 特徴ベクトル ・TF-IDF等ベクトル生成 ・ベクトルの各種演算 ・多様な正規化手法 ・類似度・距離計算など 形態素解析 ・茶筌 ・MeCab ・SSTagger ・Porter Stemmer Web検索 ・ページ (Google, Yahoo) ・Blog (Goo, Livedoor) ・動画 (Youtube, Yahoo) ・画像 (Google, Flickr)

1時間でできるプログラム例 – その1 検索エンジンから結果を取得して表示 Google で 京都 を検索 YouTube で 京都 を検索 Google SOAP Search API Yahoo ウェブ検索 Webサービス Livedoor blog 検索 Goo blog 検索 Youtube API Google で 京都 を検索 YouTube で 京都 を検索

1時間でできるプログラム例 – その2 Youtube映像検索&Viewer 京都 で検索 ビデオ 結果のリスト タグやコメント

1日でできるプログラム例 – その1 Yahoo!関連検索ワードもどき ①’使用する検索エンジンを簡単に変更することができる。 ① 検索エンジンに対してクエリを投げ、結果を取得 ⑥ 左クリックすると「京都 ホテル」で検索した結果ページをブラウザで開く ② 検索結果のタイトルの一覧 ⑥ 右クリックすると「京都 ホテル」に対する関連検索ワードを新たに求める ③ 検索結果の スニペットの一覧 ④ スニペットにおける語の出現頻度を数える (TFベクトルの作成) ⑤ その語がどの検索結果に出現しているか

1日でできるプログラム例 – その2 Web検索を利用した兄弟概念を表す語の発見 (のプロトタイプシステム) 英語版の作成も容易に可能 ① Google検索でタイトルとスニペットを100件取得。 ④ TFやTF-IDFなど、様々な重みづけを試しながら特徴語を抽出。 ② 茶筌による形態素解析を利用して解析。 ⑤各種アルゴリズムを用いたクラスタリングを試して実装。閾値操作をスライドバーで対応。 ②’解析器を交換することで容易に英語対応が可能。 ③ 特徴ベクトルライブラリの演算機能、ソート機能などを活用して結果の作成・表示。

追加1日でできるプログラム例 兄弟概念を表す語のグラフ表示

視覚的プログラミング環境 ドラッグ&ドロップで機能を配置 SlothLibの各種機能をブロックとして実装 ブロック間を接続して機能が連携 ブロックの動作はマウス操作で変更可能

ライブラリに関する情報 公開用Webページ コンタクト用アドレス http://www.dl.kuis.kyoto-u.ac.jp/slothlib/ コンタクト用アドレス slothlib-contact@dl.kuis.kyoto-u.ac.jp