Presentation is loading. Please wait.

Presentation is loading. Please wait.

オープン・アーカイブ・イニシアチブ メタデータ・ハーベスティング・プロトコル OAI-PMHの概要

Similar presentations


Presentation on theme: "オープン・アーカイブ・イニシアチブ メタデータ・ハーベスティング・プロトコル OAI-PMHの概要"— Presentation transcript:

1 オープン・アーカイブ・イニシアチブ メタデータ・ハーベスティング・プロトコル OAI-PMHの概要
Jewel Ward 慶應義塾大学訪問研究員 ライブラリシステム研究会セミナー 三田キャンパス  The Open Archives Initiative Protocol for Metadata Harvesting: Overview Jewel Ward Visiting Scholar, Keio University Lib-Sys Seminar, Keio University, Mita Campus 17 June 2003

2 謝辞 JCDL 2001/2002: OAI-PMH Introduction
Hussein Suleman (then at Virginia Tech) JCDL 2003: Introduction to the OAI-PMH Timothy W. Cole (UIUC) William H. Mischo (UIUC) Thomas Habing (UIUC) Acknowledgements:

3 謝辞 JCDL 2003: Advanced Overview of Version 2.0 of the OAI-PMH
Michael L. Nelson (Old Dominion University) Herbert Van de Sompel (LANL) Simeon Warner (Cornell University) Digital Library Federation (DLF) Spring Forum 2003 "The OAI Static Repository: a file-based approach to exposing metadata via the OAI-PMH." This research was conducted by Patrick Hochstenbach (LANL), Henry Jerez (LANL) and Herbert Van de Sompel. Acknowledgements:

4 発表の概要 機関レポジトリ(ごく簡単に) OIA-PMHの背景と開発の経緯 OAI-PMH の基本 新しい展開 関連サイト 質疑応答
Outline: Briefly: Institutional Repositories Background & Development OAI-PMH Basics New Developments Further Information Questions?

5 機関レポジトリ 機関レポジトリ: 単数または複数の大学などの機関の知的成果を収集し保管するためのデジタルコレクション
機関レポジトリ: 単数または複数の大学などの機関の知的成果を収集し保管するためのデジタルコレクション 現在の分散した方法に対して、 機関の研究成果を集中できる Institutional Repositories: Institutional Repository: digital collections capturing and preserving the intellectual output of a single or multi-university community It’s a way to aggregate the research output of an organization into one location as opposed to the current “scatter” method

6 機関レポジトリ arXiv は機関レポジトリではありません! (現在は @Cornell University)
LANL の機関レポジトリ・プロジェクト AISTI (the Alliance for Innovation in Scientific and Technical Information) Within LANL Institutional Repositories: arXiv is not an institutional repository (and it is University) Current LANL institutional repository projects AISTI (the Alliance for Innovation in Scientific and Technical Information) Within LANL

7 関連の動きとプロトコル オープン・アーカイブの動き OAメタデータ・ハーベスティング・プロトコル 研究成果や学術資料への一般のアクセス促進
商業出版者による学術雑誌の価格高騰への対応 OAメタデータ・ハーベスティング・プロトコル Eプリント・レポジトリーや電子図書館の増加 Eプリント/図書館のコミュニティが学術アーカイブの 相互運用性を求めた Movement and Protocol: The Open Archives Movement Enhance public access to research output and scholarly materials Reaction to commercial publisher’s pricing of scholarly journals The Open Archives Protocol for Metadata Harvesting Number of ePrint repositories and DLs growing ePrint/Library community desired interoperability of scholarly archives

8 OAI-PMH 技術開発 Gopher, FTP 総合目録 Z39.50 Kahn-Wilensky Framework
Dienst Protocol Harvest UPS (Universal Preprint Services) OAI-PMH OAI-PMH Technical Development: Gopher, FTP Union Catalogs Z39.50 Kahn-Wilensky Framework Dienst Protocol Harvest UPS OAI-PMH

9 OAI-PMHの概要 OAI-PMHとは? OAI と OAI-PMHの違い
メタデータ・ハーベスティングを通じて、電子図書館の相互運用性のためにアプリケーションに依存しないし様を定義する規約 様々なサービスや機能を可能にする、または促進する基礎を構築する規約 OAI と OAI-PMHの違い Overview of the OAI-PMH: What is the OAI-PMH? The protocol defines an application-independent specification for the interoperability [of digital libraries] through metadata harvesting. The protocol is a building block that can facilitate/enable variety of services and functions. OAI versus OAI-PMH

10 OAI-PMHの概要 OAI-PMHとは? --以下のものではありません 検索サービス データベース
オープン・アーカイブの情報システムそのもの メタデータの仕様定義 ダブリンコア Overview of the OAI-PMH: What the OAI-PMH is not The protocol is not a search service The protocol is not a database The protocol is not OAIS The protocol does not define a metadata specification The protocol does not equal Dublin Core

11 データ/サービス 提供者 データ提供者 (DPs) – レポジトリ
 リソースとメタデータを所有し、OAIプロトコルによってメタデータを他のDPと共有しようとする組織や個人 サービス提供者 (SPs) – ハーベスタ   検索など高レベルのサービスを利用者に提供するためDPからメタデータを収集する組織や個人 DP=サーバ、SP=クライアント Data & Service Providers: Data Providers (DPs) – Repositories – refer to entities who possess resources and metadata and are willing to share metadata with others via well-defined OAI protocols Service Providers (SPs) – Harvesters – are entities who harvest metadata from DPs in order to provide high level services to users (such as search and discovery). Data equals server, Service equals client

12 OAI-PMH 要求セット 要求 機能 Identify レポジトリに関する記述 ListMetadataFormats
サポートしているメタデータ形式 ListSets 定義されているセット ListIdentifiers OAI 固有識別子 ListRecords N個のレコードのリスト GetRecord 単独レコードのリスト レポジトリ に関する メタデータ 収集要求 OAI-PMH Verb Set: Verb Function <Metadata about the repository> Identify description of repository ListMetadataFormats metadata formats supported by repository ListSets sets defined by repository <harvesting verbs> ListIdentifiers OAI unique ids contained in repository ListRecords listing of N records GetRecord listing of a single record Most verbs take arguments: dates, sets, ids, metadata formats and resumption token (for flow control). 多くの要求は引数を持つ: dates, sets, ids, metadata formats および resumption token (フローコントロール用)

13 OAI-PMH のメタデータ ダブリンコア・エレメントセット -- 必須 さらに表現豊かなメタデータ形式 -- 強い推奨
ダブリンコア・エレメントセット  -- 必須 さらに表現豊かなメタデータ形式 -- 強い推奨 その他のメタデータ形式の例: MARC RFC-1807 Open Languages Archives Community Metadata Set Electronic Theses and Dissertation Metadata Set OAI-PMH Metadata: Repositories are required to expose their metadata as the Dublin Core Metadata Element Set (DCMES). Repositories are strongly encouraged to expose their metadata in more expressive formats. Examples of other formats in use: MARC RFC-1807 Open Languages Archives Community Metadata Set Electronic Theses and Dissertation Metadata Set

14 resource – item - record
リソース – アイテム – レコード リソース set-membership is item-level property   ダビデ像に関する   あらゆるメタデータ アイテム item = identifier resource – item - record [Statue of David]  resource all available metadata about David item Dublin Core, MARC, SPECTRUM metadata  records set-membership is item-level property item = identifier Dublin Core metadata MARC SPECTRUM レコード レコード= 識別子 + メタデータ + 日付スタンプ

15 固有識別子 それぞれのアイテムは固有識別子が必須 識別子はURIシンタックスの後に記述 OAI 方式: その他の方式も可:
oai:<archiveID>:<recordID> oai:etd.vt.edu:edt その他の方式も可: http handle Unique Identifiers: Each item must have a unique identifier Identifiers must follow the URI syntax OAI has its own format: oai:<archiveID>:<recordID> oai:etd.vt.edu:edt Can also use other formats http handle

16 日付スタンプ 差分収集のために必須 YYYY-MM-DDまたは YYYY-MM-DDThh:mm:ssZ (世界標準時)の方式
メタデータ中の日付とは異なる メタデータ収集にのみ使用 メタデータ「レコード」の生成日付 出版年月日ではない アイテムの作成日付ではない Datestamps: Required to support incremental harvesting Can be either YYYY-MM-DD or YYYY-MM-DDThh:mm:ssZ (must be GMT timezone) Different from dates within the metadata; this datestamp is used only for harvesting The datestamp is the creation date of the metadata record itself It is not the publication date It is not the creation date of the item

17 セット オプション(DPによる) setSpec & setNameが必須 それぞれのDP中のsetDescriptionは任意
サブコレクションの収集のために階層構造を設けることも可 ( “:”を使用) Sets: Optional, depends on local DPs Must provide setSpec & setName, may provide setDescription, for each set in DP May be hierarchical (use “:”) to allow for harvesting of subcollections

18 OAI-PMH の要求と応答 OAI “要求” Identify ListMetadataFormats ListSets
ListIdentifiers ListRecords GetRecord サービス提供者       データ提供者 ハーベスタ レポジトリ OAI HTTP 要求 OAI (OAI 要求) How the OAI-PMH Works OAI “VERBS” Identify ListMetadataFormats ListSets ListIdentifiers ListRecords GetRecord Service Provider Metadata Provider Harvester Repository ------ HTTP Request (OAI Verb)  HTTP Response (Valid XML) HTTP 応答 (Valid XML)

19 ベースURL+要求の例 http://arXiv.org/oai2?verb=Identify
baseURL+verb: Examples

20 応答の例 <?xml version="1.0" encoding="UTF-8" ?>
- <OAI-PMH xmlns=" xmlns:xsi=" xsi:schemaLocation=" <responseDate> T20:13:50Z</responseDate> <request verb="GetRecord" metadataPrefix="oai_dc" identifier="oai:arXiv.org:acc-phys/ "> - <GetRecord> .. </GetRecord> </OAI-PMH> Example Response:

21 レコードの例 - <record> - <header>
<identifier>oai:arXiv.org:acc-phys/ </identifier> <datestamp> </datestamp> <setSpec>physics:acc-phys</setSpec> <setSpec>physics:physics</setSpec> </header> - <metadata> - <oai_dc:dc xmlns:oai_dc=" xmlns:dc=" xmlns:xsi=" xsi:schemaLocation=" <dc:title>Symplectic Computation of Lyapunov Exponents</dc:title> <dc:creator>Habib, Salman</dc:creator> <dc:creator>Ryne, Robert D.</dc:creator> <dc:subject>Accelerator Physics</dc:subject> <dc:description>..</dc:description> <dc:description>Comment: 12 pages, uuencoded PostScript (figures included)</dc:description> <dc:date> </dc:date> <dc:type>text</dc:type> <dc:identifier> </oai_dc:dc> </metadata> </record> Example Record:

22 コンテナエレメント(オプション) レポジトリレベル (set) メタデータレコードレベル
<Identify><description> レポジトリに関する追加的情報 oai-identifier, eprints, friends, branding, other… <ListSets><setDescription> メタデータレコードレベル <about> 「メタデータのメタデータ」(レコードレベルの権利情報など) Optional Container Elements: Repository level (set) <Identify><description> Additional information about repository oai-identifier, eprints, friends, branding, other… <ListSets><setDescription> Metadata level <about> Meta-metadata, i.e. record level rights

23 Resumption Tokensほか RT / フローコントロール / ロードバランス
クライアント(SP)が、後で結果を受け取るため、  サーバ(DP)へ示すトークンを受け取る Resumption Tokens, etc.: Resumption Tokens/Flow Control/Load Balancing “resumptionToken” is used for an incomplete response The client is issued a response with a token which may be presented to the server to receive more results at a later time

24 Resumption Tokensほか RT / フローコントロール / ロードバランス
RTオプション: completeListSize, cursor, and expiration date attributes Sequential tokenを区切るために、from/until/metadataPrefix/set とレコード番号を使用 from!until!metadataPrefix!set!recordnumber ! !oai_dc!All!100 自動終了機能とセッション管理 Resumption Tokens, etc.: Resumption Tokens/Flow Control/Load Balancing Options include: completeListSize, cursor, and expiration date attributes Combine from/until/metadataPrefix/set and a record number indicator with delimiters into a sequential token from!until!metadataPrefix!set!recordnumber ! !oai_dc!All!100 Use a session manager with automatic expiry

25 Resumption Tokensほか 等冪性 RT / フローコントロール / ロードバランス
ハーベスタが応答を失ったり、大量の収集を一から やり直すのを避ける resumptionTokenを利用して再度、要求を送付 ハーベスタは最新のresumptionToken と 以前のトークンの両方を受けつけることが必要 Resumption Tokens, etc. Resumption Tokens/Flow Control/Load Balancing Idempotency Purpose is to allow harvesters to recover from lost responses or crashes without starting a large harvest from scratch Recover by re-issuing request using resumptionToken from previous request IMPLICATION: harvester must accept both the most recent resumptionToken issued and the previous one

26 エラーの扱い すべてのエラーメッセージは XML形式で送られる badVerb: ありえない要求
badArgument: ありえないパラメータの値あるいは 組み合わせ badResumptionToken, cannotDisseminateFormat, idDoesNotExist: パラメータの形式は正しいが、 現在の条件に合わない noRecordsMatch, noMetadataFormats, noSetHierarchy: 応答すべきものがない Error Handling: All protocol errors are in XML format badVerb: illegal verb requested badArgument: illegal parameter values or combinations badResumptionToken, cannotDisseminateFormat, idDoesNotExist: parameters are in right format but are not legal under current conditions noRecordsMatch, noMetadataFormats, noSetHierarchy: empty response exception

27 エラーメッセージの例 <?xml version="1.0" encoding="UTF-8" ?>
- <OAI-PMH xmlns=" xmlns:xsi=" xsi:schemaLocation=" <responseDate> T20:32:53Z</responseDate> <request> <error code="badArgument">Verb 'ListRecords', argument 'metadataPrefix' required but not supplied.</error> </OAI-PMH> Example Error Message:

28 OAI-PMH 静的レポジトリ 動機づけ OAI-PMH は障壁の低いプロトコルである OAI-PMH はデータ提供者に簡便さをもたらす
OAI-PMHの起源となった Santa Fe Conventionにおけるバイアス OAI-PMH Static Repository: Motivation OAI-PMH is a low-barrier protocol OAI-PMH favors to make it easy for Data Providers Bias has its origins in the Santa Fe Convention

29 OAI-PMH 静的レポジトリ 動機づけ 実装はいつも簡単というわけではない 技術の不足 コレクションが小さすぎて投資に足らない
データベースのセキュリティへの配慮 ISP がサード・パーティのソフトウエアを許可しない Cf. OLAC, union catalogue, LoCKSS OAI-PMH Static Repository: Motivation Implementation is sometimes not trivial Lack of technical expertise Size of collection does not justify the investment Security considerations re: database ISP does not allow 3rd party software Cf. OLAC, union catalogue, LoCKSS

30 OAI-PMH 静的レポジトリ そこで、、、 OAI-PMHを通じて、メタデータコレクションを 共有するための障壁を、さらに下げるための
研究を開始! OAI-PMH Static Repository: Motivation Therefore: research to devise approaches to further lower the barrier to sharing metadata collections through the OAI-PMH.

31 OAI-PMH 静的レポジトリ OAI-PMH Static Repository

32 権利に関する工夫 権利に関する検討: Creative Commons (CC)における フレームワーク JISC/OAI/CCの共同研究
リソース メタデータ Creative Commons (CC)における フレームワーク JISC/OAI/CCの共同研究 JISC: “Joint Information Systems Committee” (RoMEOを含む) Rights Effort: Exploring rights about: Resource Metadata Framework based on the Creative Commons (CC) Collaborative Effort JISC/OAI/CC (JISC is the “Joint Information Systems Committee”involved with RoMEO.)

33 関連サイト Institutional Repositories Partnering with Faculty to Enhance Scholarly Communication SPARC Institutional Repository Checklist & Resource Guide

34 関連サイト Open Archives Initiative OAI Metadata Harvesting Protocol
OAI Metadata Harvesting Protocol OAI-PMH Tools Index Virginia Tech DLRL OAI Projects Repository Explorer ARC Cross-Archive Search Service Further Information:

35 関連サイト ARC Cross-Archive Search Service OAI-PMH Static Repository
OAI-PMH Static Repository Registration Example Repository Specification

36 関連サイト Creative Commons JISC Dspace E-Prints DL-in-a-box
JISC Dspace E-Prints DL-in-a-box Greenstone Digital Library

37 関連サイト NDLTD XML Schema Validator Dublin Core Metadata Initiative
XML Schema Validator Dublin Core Metadata Initiative XML Tools at W3C

38 ご質問は?


Download ppt "オープン・アーカイブ・イニシアチブ メタデータ・ハーベスティング・プロトコル OAI-PMHの概要"

Similar presentations


Ads by Google