OAI-PMHと図書館サービス -千葉大学附属図書館での事例を交えて- 尾城 孝一 ojiro@ll.chiba-u.ac.jp 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAIとは 正式名称 使命と支援組織 歴史 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 正式名称 Open Archives Initiative http://www.openarchives.org/ “Open”とは 「無償」ではなく「開かれたシステム」 “Archive”とは 厳密な意味での「アーカイブ」ではなく,広い意味での情報を蓄積するためのリポジトリ(サーバ) 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 使命と支援組織 使命 多様な電子コンテンツの効果的配信を促すために,相互運用性に関する標準を策定し,それを普及させる 支援組織 Coalition for Networked Information: CNI Digital Library Federation: DLF National Science Foundation: NSF 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAIの歴史 1999年10月(サンタフェ会議) OAIの結成 eプリント・アーカイブの相互運用性の確立 メタデータ・ハーベスティングに基づくフレームワーク(サンタフェ協定) 2000年6月(第2回会議) 活動範囲の拡大(eプリント・アーカイブ→各種電子コンテンツのリポジトリ) 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAIの歴史(続き) 2001年1月 メタデータ収集プロトコル(Open Archives Initiative Protocol for Metadata Harvesting: OAI-PMH) Ver.1.0が制定 2002年6月 OAI-PMH Ver.2.0発表 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAI-PMHとは 基本的概念と定義 OAIフレームワークの構成者 ハーベスタとリポジトリ アイテムとレコード セットと選択的収集 プロトコルの特徴 OAI-PMH要求 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAI-PMHフレームワークの構成者 データプロバイダ リポジトリを維持し,OAI-PMHによりメタデータを開示する サービスプロバイダ OAI-PMHを使用してデータプロバイダから収集したメタデータに基づき,付加価値のあるサービスを提供する 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) リポジトリとハーベスタ リポジトリ OAI-PMHの要求に対して応答することのできるネットワークアクセス可能なサーバ ハーベスタに対してメタデータを開示するために,データプロバイダが管理する ハーベスタ OAI-PMH要求を発行するクライアント・アプリケーション サービスプロバイダがリポジトリからメタデータを収集する手段として使用する 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) リポジトリとハーベスタの関連図 要求 各種要求,収集条件, メタデータのフォーマット等の指定 リポジトリ データプロバイダ ハーベスタ サービスプロバイダ 応答 利用可能なメタデータフォーマット, リポジトリの情報,メタデータレコード等 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAIの3層モデル 評価 クロス 検索 サービス層 (サービスプロバイダ) リンキング メタデータ・ハーベスティング プロトコル層 eプリント アーカイブ 電子図書館 サーバ OPAC リポジトリ データ層 (データプロバイダ) 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) アイテムとレコード アイテム リポジトリの構成要素 あるひとつのリソースに関するメタデータを複数のフォーマットで蓄積する概念的な容れ物(コンテナ) アイテムに包含されるさまざまなフォーマットのメタデータは,OAI-PMHを通じてレコードとして収集される リポジトリのなかでアイテムを一意に同定する識別子を持つ レコード あるひとつのフォーマットで表現されたメタデータ OAI-PMHの要求に対して,XMLでコード化されたバイト・ストリームとして返戻される 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) アイテムとレコードの関連図 ダブリンコア形式 のレコードを要求 ダブリンコア レコード ハーベスタ1 アイテム スキーマA スキーマA形式 のレコードを要求 レコード ハーベスタ2 リポジトリ 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) セットと選択的収集 セット 選択的収集のために複数のアイテムをグルーピングする概念 必須ではない 選択的収集 セットと日付スタンプを指定して,選択的にメタデータを収集することが可能 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) プロトコルの特徴 HTTP要求 OAI-PMHの要求は,HTTPのGETもしくはPOSTを使って送信される XML応答 OAI-PMHの要求に対する応答は,全てXMLでエンコードされ,文字コードにはUTF-8が使用される メタデータ・フォーマット OAI-PMHは複数のメタデータ・フォーマットでのレコードの送信をサポート 限定詞なしのダブリンコア(Simple DublinCore)での送信は必須 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAI-PMH要求 GetRecord リポジトリから個々のメタデータ・レコードを取得する Identify リポジトリに関する情報を取得する ListIdentifiers リポジトリからレコード中のヘッダー情報のみを取得する ListMetadataFormats リポジトリにおける利用可能なメタデータ・フォーマットの一覧を取得する ListRecords リポジトリから条件に合致するレコード全てを取得する ListSets リポジトリのセット構造を取得する 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
要求サンプル(GetRecord) http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0? ベースURL http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0? verb=GetRecord& metadataPrefix=oai_dc& identifier=oai:mitizane.ll.chiba-u.jp:00020115 要求の種別 引数 リポジトリ(http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0)から 識別子oai:mitizane.ll.chiba-u.jp:00020115のレコードを oai_dcのメタデータフォーマットで取得せよ 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 要求・応答例 OAI Repository Explorer http://oai.dlib.vt.edu/cgi-bin/Explorer/oai2.0/testoai 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 日本語訳 OAI-PMHの日本語訳(NII) http://www.nii.ac.jp/metadata/oai-pmh2.0/ 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) OAI-PMHの適用事例 関連プロジェクト データプロバイダ サービスプロバイダ 千葉大学附属図書館の事例 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 関連プロジェクト NSDL(National Science Digital Library) http://nsdl.org/ NSFが助成するプロジェクト サイエンスに関する多様なデジタル・コンテンツを提供する電子図書館の構築をめざす NSDLのシステム・アーキテクチャにおいて,OAI-PMHは重要な役割を果たしている 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 関連プロジェクト(続き) メロン財団メタデータ・ハーベスティング・イニシャティブ 7機関 助成金総額150万ドル 課題 複数機関,複数分野にまたがる広範囲なメタデータに基づくポータル・サービスの設計 アーカイブや特殊コレクションからのメタデータ・ハーベスティング 特定主題の多様なフォーマットの資料に関するメタデータ・ハーベスティング 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 関連プロジェクト(続き) OAIster http://oaister.umdl.umich.edu/o/oaister/ ミシガン大学のプロジェクト イリノイ大学が開発したハーベスタを使用 167機関から収集した1,183,995件(2003年5月1日現在)のメタデータ・レコードの検索サービスを提供 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) データプロバイダ 現在,94のリポジトリがOAI-PMH(ver.2.0)に準拠したデータプロバイダとして登録されている http://www.openarchives.org/Register/BrowseSites.pl 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) サービスプロバイダ OAI準拠登録サービスプロバイダ http://www.openarchives.org/service/listproviders.html ARC http://arc.cs.odu.edu/ オールドドミニヨン大学が開発した複数リポジトリのクロス検索システム my.OAI http://www.myoai.com/ OAI準拠のデータベースを統合検索するための多機能サーチエンジン NDLTD OAI Union Catalog http://rocky.dlib.vt.edu/~etdunion/cgi-bin/index.pl 電子学位論文ネットワーク(Networked Digital Library of Theses and Dissertations: NDLTD)のOAI版総合目録 SCIRUS http://www.scirus.com/ エルゼビア社が開発した学術文献に特化したサーチエンジン。OAI-PMHによって収集されたメタデータを含む 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 千葉大学におけるプロジェクト 千葉大学学術情報リポジトリ・プロトタイプの構築 学術機関リポジトリ(Institutional Repository)の一種 千葉大学内で生産された電子的な知的生産物(学術論文,学位論文,プレプリント,統計・実験データ,教材,ソフトウェアなどの学術情報)を蓄積,保存し,学内外に発信するためのインターネット上の保存書庫 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) NIIとのOAI連携概念図 千葉大学 国立情報学研究所 世界に向けた情報発信 JuNii 検索インターフェイス ・リポジトリ管理 ・メタデータ管理 ・ライセンス管理 ・長期保存 ・既存資料(紙媒体) の電子化 メタデータ データベース 千葉大学 学術情報リポジトリ (仮称) OAI-PMHのよるメタデータ連携 図書館 コンテンツ 投稿システム 論文 プレプリント ファクトデータ ソフトウェア データベース 学位論文 電子教材 学内研究者等 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) Z39.50とOAI-PMH 目的の違い 横断検索システム構築における長短 相互補完的な仕組み 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 目的の違い 共に分散サーバ(リポジトリ)間の相互運用性を確立するための規格とみなされているが... 目的が違う Z39.50は情報検索用のプロトコル OAI-PMHはメタデータ収集のためのプロトコル 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 横断検索システム構築における長短 Z39.50 分散型 実装コスト(高) 検索機能が豊富 レスポンスはサーバの性能,ネットワークの渋滞度の影響を受ける スケーラビリティに限界 タイムラグなし OAI-PMH 集中型 実装コスト(低) 検索機能なし(サービスプロバイダが用意する必要あり) レスポンスの問題は少ない スケーラビリティの問題は少ない タイムラグの問題あり(収集頻度に依存) 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
ライブラリーシステム研究会(慶応大学三田図書館) 相互補完的な仕組み コミュニティ内の複数リポジトリからメタデータをOAI-PMHで収集 統合データベースにZ39.50ターゲット機能を実装して検索サービスを提供 事例 RDN ResourceFinder http://www.rdn.ac.uk/ RDNは英国のサブジェクト・ゲートウェイのネットワーク 参加サブジェクト・ゲートウェイからOAI-PMHによってメタデータを収集し,ResourceFinderという統合データベースを構築し,Z39.50による検索サービスを提供。 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
NIIメタデータデータベースと OAI-PMH サービスプロバイダとしてのNII-MDDB データプロバイダとしてのNII-MDDB 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
サービスプロバイダとしての NIIメタデータデータベース ナショナル・リポジトリ OAI-PMHによるメタデータ・ハーベスティング A大学 D研究所 B大学 C大学 学術機関リポジトリ 論文 データ 教材 ソフトウェア 学術機関リポジトリ 論文 データ 教材 ソフトウェア 学術機関リポジトリ 論文 データ 教材 ソフトウェア 学術機関リポジトリ 論文 データ 教材 ソフトウェア 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
データプロバイダとしての NIIメタデータデータベース サービスプロバイダ NIIメタデータ データベース 各種 ポータル サービス 利用者 OAI-PMHによる 選択的収集 登録処理 直接入力 個別収集 OAI-PMH 収集 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)
おわりに:開発メーカーの皆さんへのお願い OAI-PMH関連ツールのオープンソース化 リポジトリ関連ツール OAIB Access,Oracle,MySQL等のリレーショナル・データベースに蓄積されたメタデータをハーベスタに開示するためのツール http://dlt.ncsa.uiuc.edu/oaib/ OAICat(OCLC) http://www.oclc.org/research/software/oai/cat.shtm DSpace http://www.dspace.org/ EPrints.org http://www.eprints.org/ ハーベスタ OAIHarvester(OCLC) http://www.oclc.org/research/software/oai/harvester.shtm 付加価値サービスのためのソフトウェアで競争 2003/6/17 ライブラリーシステム研究会(慶応大学三田図書館)