平成22年6月15日 図書系職員のための アプリケーション開発講習会

Slides:



Advertisements
Similar presentations
図書・雑誌・論文検 索 岩手大学情報メディアセンター図書館 - 2012年 -. 検索とは 文書やデータの中から必要な事項をさがし 出すこと(広辞苑第6版) 文書やデータの中から必要な事項をさがし 出すこと(広辞苑第6版) – インデックス型 文字列が検索キー
Advertisements

Copyright © Kazuhito HAMANO 2007 all Rights Reserved. 1 情報基礎( Week4 ) ≪ WWW で展開される新しい技術≫ 非常勤講師 濱野和人 2007/5/8 火曜 1,2,3 限
雑誌記事 DB の使用方法. 8-3 MAGAZINEPLUS データベース 38) 概要 MAGAZINEPLUS ( NICHIGAI/WEB サービス) – 約 30,000 誌、 11,000,143 件( 2010/01/22.
電子書籍の検索機能の改善 木下研究室 201002713 鴫原 善寿. 背景 スマートフォンなどの携帯端末の普及と ともに電子書籍に注目が浴びた。中でも amazon の kindle など電子書籍の専用端末も 現れた。 電子書籍はデータなので本棚もいらず、 持ち運びも容易になるなど様々な恩恵を もたらした。
NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
図書系のための アプリケーション開発講習会 2008年7月31日
国立情報学研究所(NII)のデータベース活用法
5.コンピュータ目録とカード目録 5-1.カード目録.
④CiNii ⑤NDL-OPAC(雑誌記事) ⑥日経BP
国内線で新千歳空港を利用している航空会社はどこですか?
情報処理基礎 2006年 6月 1日.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
未来をめざす図書館職員自作アプリ 平成22年11月 24-26日 図書館総合展ポスター展示
図書DBの使用方法 NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
レポート・論文のための 資料の探し方講習会 統計資料編
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
夢見る図書館情報システム The Cards Challenge !
三上研究室学生のための 文献検索および入手の基礎講習
テキストマイニング, データマイニングと 社会活動のトレース
伝統的件名標目の特徴 図書館界における統制語彙表。通常全分野型。 (1)統制語である 同義語の統制 例:絵、書画→絵画 警官→警察官
ネットで百科 for Library の使いかた
教育学部「文章作成法I」 (水)1講時 茨城大学図書館・情報支援係
NIIメタデータデータベースの構想 国立情報学研究所 開発・事業部 コンテンツ課 米 澤 誠
検索テーマ [糖尿病における高脂血症の薬物療法] 丸善株式会社 教育・学術事業本部 商品センター
国立情報学研究所 メタデータ・データベース 共同構築事業について
平成19年5月19日 第3版 東京大学理学部生物化学図書室 前田 朗
平成19年11月16日 図書系職員のためのアプリケーション開発講習会
医中誌Web利用講習会 平成23年5月31日 丸善株式会社.
情報検索演習の基礎 1.どういう検索をするのか コンピュータを用いた検索である
図書館ツール発想日記 ~「東京大学内のサイトから関連学術用語のデータを得る」(仮称)システムへの寄り道思考経路~
テキストの類似度計算
セマンティクスを利用した 図書検索システム
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
初心者のためのセキュリティ/プライバシー講座
CiNIIほかに関連語提示機能を ~つっこみの第二回~
医中誌Web利用講習会 平成23年5月31日 丸善株式会社.
平成21年9月17日(木) 「図書系職員のための アプリケーション開発講習会」
日本語解析済みコーパス管理ツール 「茶器」
近畿大学工学部情報学科情報システムコース 切戸健勝
ガジェット・マスターへの まわり道!? ~Ajaxを理解しよう~
図書館職員のための アプリケーション開発講習会
東京大学OPAC Plus “言選Web” -関連学術用語による日本語文献情報への 簡易ナビゲーションシステム-
ご利用説明 2018年10月 (株)紀伊國屋書店.
環境リスクマネジメントに関する 検索システム
利用説明 2018年9月 (株)紀伊國屋書店.
ネットショップデザイン入門Ⅰ・ⅡSEO 2013/12/18 Webデザイン入門 SEOの基本.
平成20年6月11日 「図書系のための アプリケーション開発講習会」
平成19年10月19日 図書系のための アプリケーション開発講習会
パスファインダーの作成 ※ をダウンロードして読んで下さい。
クイックガイド <キーワードによる検索方法>
パスファインダーの作成 ※ sakura. ne. jp/CJE121023
知識情報演習Ⅲ(後半第2回) 辻 慶太
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
テキストマイニング, データマイニングと 社会活動のトレース
平成16年度東京大学技術職員研修 データベース検索
実空間における関連本アウェアネス 支援システム
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
資料2-2 平成26年度 第2回技術委員会資料 次年度検討テーマ案
シソーラスとは? ①文章作成用の類義語辞典 → 普通に書店に売っている。 『日本語大シソーラス』 (大修館書店) など。
構造的類似性を持つ半構造化文書における頻度分析
設計情報の再利用を目的とした UML図の自動推薦ツール
卒論のための資料探し 平成22年6月29日~30日 茨城大学図書館 図書館キャラクター 「わらづと君」
大規模コーパスに基づく同義語・多義語処理
自然言語処理2015 Natural Language Processing 2015
人文、社会、自然、医療、理工等、総合分野を網羅した学術機関向けの 全文データベース (2014年4月1日より開始)
自然言語処理2016 Natural Language Processing 2016
「図書系職員のための アプリケーション開発講習会」
Presentation transcript:

平成22年6月15日 図書系職員のための アプリケーション開発講習会 国会図書館件名標目連想検索 平成22年6月15日 図書系職員のための アプリケーション開発講習会

文章か キーワード入力 画面イメージ

入力から「連想」する国会図書館件名標目とそのスコアを表示 文章か キーワード入力 入力から「連想」する国会図書館件名標目とそのスコアを表示 (Ajax使用) 画面イメージ

国会図書館件名標目2008 国会図書館のサイト(以下)から非営利目的なら入手可能 拙作のPerlモジュール”MARC::NDLSH”も提供中 http://www.ndl.go.jp/jp/library/data/ndlsh_download.html 拙作のPerlモジュール”MARC::NDLSH”も提供中 https://mbc.dl.itc.u-tokyo.ac.jp/MARC-NDLSH/

自然文から 国会図書館件名標目を検索 国会図書館件名標目には、 それに結びついた文章がない…. だから、テキストマイニングができない? 文章がなければ、自分で文章を用意すればいいのに

国会図書館件名標目と 国内学術Webサイト 国会図書館件名標目に文章を結びつけ Yahoo! のWeb検索を使う 日本語の個々の件名(標目形)について、国内学術Webサイト(ドメインac.jpのサイト)を検索 トップ100件、スニペット(抜粋)のみ使用 件名を付与された書籍タイトルや その目次情報を使うことも考えられる

当初はニューラルネットを 当初はニューラルネットワークを使い、用語から「国会図書館件名標目」を推薦する仕組みを考えていた 面倒そうなので途中でとりやめ R言語のニューラルネットワーク Perlのニューラルネットモジュールの利用 Python(「集合知プログラミング」のサンプルコード) GETAssocを使って楽することに

単語・文書行列 単語の関連を調べるには「単語の共起」(同コンテンツで同時に出現する)を求めるのがセオリー 単語・文書行列(ベクトル空間法)を使うのがよくある手法だが… 文書A 文書B 文書C 単語A 1 単語B 単語C

件名標目・単語行列 ちょっと邪道(?)だが、「件名標目・単語行列」を作成 特に工夫せず、形態素解析器”和布蕪”により抽出した単語(形態素)と、TF*IDFを使用 件名A 件名B 件名C 単語A 1 単語B 単語C

国会図書館件名標目の 特色を生かす(1) 比較すべき対象 Wikipedia(専門用語もありかなり有力) 日本語WordNet もともと用語と解説文が結びつけれている 「想-Imagine」等にて実現すみ 日本語WordNet 国会図書館件名標目連想検索と同様の仕組みを作成できるが…

国会図書館件名標目の 特色を生かす(2) 国会図書館職員の件名選択の特色 上位語と下位語などの関連を生かす 国会図書館の分類記号を使う 国会図書館十進分類がついている PORTAの件名検索と連携させる 手間がかかるので、とりあえず保留中!

https://mbc.dl.itc.u-tokyo.ac.jp/NDLSH_assoc// 試行公開 東京大学情報基盤センター図書館電子化部門主催「図書系職員のためのアプリケーション開発講習会」のサイトで試行公開中 https://mbc.dl.itc.u-tokyo.ac.jp/NDLSH_assoc//