機関リポジトリのメタデータについて Ver.2.0 2014年2月4日 国立情報学研究所 1
今日のおはなし 1.はじめに 2.メタデータが必要なわけ 3.機関リポジトリのメタデータとは 4.機関リポジトリのメタデータを 使いやすくするしくみ 5.Junii2と博士論文のインターネット公開 6.おわりに 2
1.はじめに
はじめに 機関リポジトリの話で必ず出てくるのが、 「メタデータ」という用語です。 メタデータとはどのようなものか、 一緒にみていきましょう! 4
2.メタデータが必要なわけ
メタデータとは? 「データに関するデータ」 のことです 書籍の目録 とか 写真のキャプション もメタデータです 6
メタデータがあると、データを使う人が、ほしいデータを見つけやすくなります! メタデータは何に使う? メタデータがあると、データを使う人が、ほしいデータを見つけやすくなります! 図書館の本を例に見てみましょう リポジトリに関する本を読みたい! ISBNが「978-4-86049-047-8」の本がほしい! 利用者 たくさんの本の中から読みたい本を探すとき・・・ 7
メタデータ(目録)があると、探している本を見つけやすくなります メタデータは何に使う? メタデータ(目録)があると、探している本を見つけやすくなります 目録 件名(キーワード):リポジトリ 便利♪ ISBN:978-4-86049-047-8 利用者 さらに便利にするには・・・ 8
メタデータは何に使う? OPAC メタデータ(目録)が検索しやすくなると、探している本を、さらに見つけやすくなります! 件名(キーワード):リポジトリ OPACは簡単に探せて、とっても便利♪♪ ISBN:978-4-86049-047-8 利用者 9
機関リポジトリも同じように、メタデータがあると、データを使う人が、ほしいデータを見つけやすくなります! メタデータは何に使う? 機関リポジトリも同じように、メタデータがあると、データを使う人が、ほしいデータを見つけやすくなります! しかも、(OPACのような)検索しやすいしくみがあると、ほしいデータをさらに見つけやすくなります!! これから、くわしく見ていきましょう 10
3.機関リポジトリのメタデータとは
機関リポジトリにはいろいろな種類の データを登録できます 機関リポジトリのメタデータとは? 機関リポジトリにはいろいろな種類の データを登録できます 学術論文 書籍 教材 研究データ など このようなデータの中身を説明・紹介するデータが必要です。 それが機関リポジトリにおけるメタデータになります。
学術論文に対し「著者名」「出版者」など説明が記載されています。 機関リポジトリのメタデータとは? たとえば、JAIRO Cloudの、とある機関リポジトリをのぞいてみると・・・ 学術論文に対し「著者名」「出版者」など説明が記載されています。 これがメタデータになります 13
JAIRO Cloud(WEKO)では、データの種類を アイテムタイプによるメタデータの違い 目録と違って、機関リポジトリには、メタデータのつけかたや内容に決まりはありません。 ただし、JAIRO Cloud(WEKO)では、登録するデータの種類ごとに、メタデータの内容を取り決めています。 学術雑誌論文、紀要、学位論文を例に見てみましょう。 JAIRO Cloud(WEKO)では、データの種類を 「アイテムタイプ」と呼んでいます 14
メタデータの例 ~学術雑誌論文・紀要論文~ メタデータの例 ~学術雑誌論文・紀要論文~ JAIRO Cloud (WEKO)での例 「タイトル」「著者」のほかに、「雑誌名」や「出版者」 「抄録」などをメタデータの項目として入力できます。 「データ(論文PDFなど)の所在」、「データの更新日付」 なども、自動的にメタデータとして保存されます。 15
学術雑誌論文や紀要論文にはなかった「学位名」「学位授与機関」 メタデータの例 ~学位論文~ JAIRO Cloud (WEKO)での例 学術雑誌論文や紀要論文にはなかった「学位名」「学位授与機関」 「学位授与年月日」「学位授与番号」が、 メタデータの項目として入力できます。 16
4.機関リポジトリのメタデータを 使いやすくするしくみ 4.機関リポジトリのメタデータを 使いやすくするしくみ
機関リポジトリのデータが利用されるには? 機関リポジトリにも、OPACのような検索しやすいしくみはあるのでしょうか? CiNiiやJAIROのようなサイトを使うと、 機関リポジトリに登録されているデータを 簡単に探すことができます! 18
機関リポジトリのデータが利用されるには? CiNii※を例に見てみましょう CiNiiとは? 日本の学術論文を検索できるサービスです。 機関リポジトリに登録されているデータでは、学術雑誌 論文・紀要論文を検索できます。 19
機関リポジトリのデータが利用されるには? CiNii画面(学術雑誌論文を検索した場合) クリックすると・・・ 20
機関リポジトリのデータが利用されるには? 機関リポジトリの画面 機関リポジトリのページに移動して、本文が読めるようになります 21
機関リポジトリのデータが利用されるには? CiNiiには、個々の機関リポジトリに登録された学術雑誌論文・紀要論文の情報が集まっています。 つまり それぞれの機関のリポジトリをバラバラに探さなくても、CiNiiで学術雑誌論文・紀要論文を一気に検索することができます!! 便利♪ 利用者 22
機関リポジトリのデータが利用されるには? そのため、なにか情報が欲しいとき、ほとんどの利 用者は(CiNiiやJAIROなど)情報検索のためのサイ トを利用します。 (機関リポジトリに直接情報を探しに来る利用者は ほとんどいません。) ○○について書かれた論文を読みたい! 情報検索のサイト (例) 検索 利用者 国立国会図書館サーチ 23
機関リポジトリのデータが利用されるには? つまり、機関リポジトリに登録されたデータを使っ てもらうためには、 ことが重要です! 機関リポジトリに登録されたデータを、 情報検索のサイトで検索できる 24
CiNiiに機関リポジトリのデータが集まるしくみ リポジトリからCiNiiに論文の情報を集めるために、IRDB(学術機関リポジトリデータベース)が使われています。 くわしく見てみましょう。 25
CiNiiに機関リポジトリのデータが集まるしくみ IRBDは、機関リポジトリに登録されている文献のメタ データを集めているデータベースです。 IRDBは、機関リポジトリのメタデータを(定期的に) 持って行ってくれます。 農作物を刈り取る(収穫する)動きに似ているので、 「ハーベスティング」(Harvesting)と呼びます A大学 リポジトリ IRDB 登録された データの メタデータ B大学 リポジトリ C大学 リポジトリ ハーベスティング 26
CiNiiに機関リポジトリのデータが集まるしくみ ハーベスティングは、システムで自動的に行われています。 タイマーで定期的に実行 IRBD リポジトリ メタデータをください 了解です。送ります メタデータ
CiNiiに機関リポジトリのデータが集まるしくみ いったんIRDBに収集されたメタデータのうち、学術雑誌 論文・紀要論文のメタデータは、CiNiiにハーベスティング されます。 CiNiiの利用者は、CiNii上にあるメタデータから論文を探し たうえで、機関リポジトリ上にある本文を見に行っている のです。 利用者 検索 本文入手 IRDB 論文の メタデータ 本文PDF ハーベスティング ハーベスティング A大学 リポジトリ 登録された データの メタデータ 学術雑誌論文 ・紀要論文の メタデータ 28
データの流通するしくみ CiNii以外にも、IRDBはいろいろなデータのやりとりをしています。 IRDB 国立国会図書館 A大学 B大学 メタデータ メタデータ PDF IRDBのコンテンツを検索 IRDB B大学 メタデータ PDF C大学 PDF メタデータ 学術雑誌論文・紀要論文メタデータ D大学 日本の論文を検索 PDF 平成25年4月以降授与の 博士論文メタデータ 博士論文 PDF 国立国会図書館 メタデータの情報をもとに、国立国会図書館が論文本文を収集 博士論文 PDF 博士論文 PDF
メタデータを提供するものを、データプロバイダーと呼びます データの流通するしくみ さらに、IRDB以外でも、同じしくみはたくさん使われています。 メタデータ 提供 ハーベスティング サービス提供 機関 リポジトリ OAI-PMH 国立国会図書館サーチ 機関 リポジトリ サービスを提供するところを、 サービスプロバイダと呼びます メタデータを提供するものを、データプロバイダーと呼びます 自分の機関リポジトリのデータを検索 できるサイトが広がります! 30
サービスプロバイダに文献の紹介情報を配るしくみを、もう少し見てみましょう。 参考:OAI-PMHとは? サービスプロバイダに文献の紹介情報を配るしくみを、もう少し見てみましょう。 メタデータを配るためには、OAI-PMHという通信の仕組みが使われます。 31
参考: OAI-PMHとは? The Open Archives Initiative Protocol for Metadata Harvestingの略 リポジトリのデータを収集し,それに基づいたサー ビスを提供するために開発されたデータ提供・収集 用のプロトコル Open Archives Initiative が開発 仕様書(http://www.openarchives.org/OAI/openarchivesprotocol.html) 翻訳(http://www.nii.ac.jp/irp/archive/translation/oai-pmh2.0/) 詳細は次ページで! 32
参考: OAI-PMHとは? プロトコルとは? やりとりをするための標準のことです。 例えば「日本語」「英語」も、広い意味ではプロトコルといえます。 Pardon?? Do you like apples? Yes! リンゴは好き? 英語 英語 日本語 英語 プロトコルが違う =情報の伝達や意思疎通ができない プロトコルが同じ =情報の伝達や意思疎通ができる! 33
参考:OAI-PMHとは? 本文入手 OAI-PMHを使って、 サービスプロバイダに 文献の紹介情報を配る ことができます 検索 PDF リポジトリ PDF 本文入手 PDF OAI-PMHを使って、 サービスプロバイダに 文献の紹介情報を配る ことができます メタデータ メタデータ 利用者 メタデータ メタデータ 検索 メタデータ メタデータ サービス プロバイダA サービス プロバイダB
IRDBなどにハーベスティングしてもらうことで,CiNiiなどの外部サービスにメタデータを提供できる! まとめ つまり、 IRDBなどにハーベスティングしてもらうことで,CiNiiなどの外部サービスにメタデータを提供できる! その結果として自機関のリポジトリへのアクセスが増える!! 35
5. Junii2と博士論文の インターネット公開
学位論文の公開について 機関リポジトリでの公開が原則(学位規則の一部を改 正する省令の施行等について(通知)) 学位規則改正より、平成25年4月1日以降授与の博士 論文のインターネット公開が義務化! 機関リポジトリでの公開が原則(学位規則の一部を改 正する省令の施行等について(通知)) (2)公表の方法について 改正後の学位規則第8条及び第9条に規定するインターネットの利用による公表の具体的な方法については,当該博士の学位を授与した大学等の機関リポジトリ*(共同リポジトリ及び大学共同利用機関法人情報・システム研究機構国立情報学研究所が提供する共用リポジトリサービスにより構築されたリポジトリを含む。以下同じ。)による公表を原則とされたいこと。 http://www.mext.go.jp/a_menu/koutou/daigakuin/detail/1331796.htm より抜粋
学位論文を提出するために・・・ 以下の条件を満たすことが必要です IRDBのデータ提供機関であること (未申請機関は要申請) 2. junii2 バージョン3.0に準拠したメタデータを IRDBに提供できること 詳細情報 : http://www.nii.ac.jp/irp/archive/system/irdb_harvest.html
junii2 とは? 学位規則の改正に対応した、 バージョン.3.0が最新版です 国立情報学研究所が策定した、メタデータのフォー マット(形式)です。 ガイドライン http://www.nii.ac.jp/irp/archive/system/junii2.html http://www.nii.ac.jp/irp/archive/system/junii2_guide.html http://irdb.nii.ac.jp/oai/junii2-3-0.xsd 学位規則の改正に対応した、 バージョン.3.0が最新版です 現在バージョン3.1を検討中です
JAIRO Cloud上で登録されたメタデータは、junii2に対応するようにあらかじめ設定されています junii2はIRDBやCiNii、JAIROで使われています。 もちろんJAIRO Cloudでも、junii2に対応しています。 JAIRO Cloudのマッピング設定画面 JAIRO Cloud上で登録されたメタデータは、junii2に対応するようにあらかじめ設定されています
junii2 とは? junii2では、メタデータの各項目について、記入のルール・ 使用例や書式、注意点などが取り決めてあります。 junii2に対応していると、システムがメタデータを正しく ハーベスティングできるようになります。 junii2対応 title リポジトリのひみつ 情報太郎 平成22年2月1日 creator 情報, 太郎 NDC 007 日本 007 Desc- ription リポジトリのメタデータについての初心者向けの講座・・・ リポジトリのひみつ date 2010-02-01 リポジトリのメタデータについての初心者向けの講座・・・ language jpn ハーベスティングできる! ???
junii2 ガイドラインの見方 junii2では、メタデータの各要素について、記入ルール、 使用例、書式、注意点などの取り決めがまとめられた ガイドラインが作成されています。 Junii2ガイドラインの例
junii2 ガイドラインの見方 JAIRO Cloudでは、必要に応じて、マッピング(junii2 のどの要素とメタデータの項目を対応させるか)の設 定を変えることができます。 JAIRO Cloudのマッピング設定画面 マッピングの設定を変えることができます
junii2 バージョン 3.0でのメタデータのポイント (学位論文関係のみ) データ項目 変更内容 例 備考 学位授与番号 新規追加項目 12345A9876 科研費機関番号(数字5桁) [ 甲>A | 乙>B | 他>Z ] 報告番号 学位授与年月日 2013-06-30 YYYY-MM-DD形式 学位名 博士(理学) 学位授与機関 国立情報学研究所 著者版フラグ 博士論文の本文がある場合は、”ETD”を入力する ETD 「やむを得ない理由」で要旨にする場合は、”none”を入力 Ver.3.1で変更予定 ※「国立情報学研究所メタデータ主題語彙集(資源タイプ)」(NIItype)の変更はありませんが、博士論文の場合は、” Thesis or Dissertation” を指定ください
junni2 バージョン3.0 運用上の注意点 追加されたデータ項目 IRDBのデータチェック 学位授与番号 学位論文関係のデータ項目と、学位論文と関係しないデータ項目 (「NII論文ID」,「JaLCDOI」など)があります。 IRDBのデータチェック 「著者版フラグ」の値が”ETD”のときのみチェックがかかります 「学位授与番号」や「学位授与年月日」は、指定のフォーマット とする必要があります 学位授与番号 報告番号の採番によっては、同一機関で同一の「学位授与番号」 になることがあります 共同大学院の「学位授与番号」は、学生の本籍がある機関で付与 します(「学位授与機関」は連名で記入します)
機関リポジトリのjunii2 バージョン 3.0への対応方法 学位授与大学は、それぞれ自機関リ ポジトリシステムの対応が必要です。 (ただし)JAIRO Cloud参加機関は、国 立情報学研究所のJAIRO Cloudシステム 一括アップデートにより可能な限り対応す る予定です。
JAIRO Cloudの一括アップデートによる junii2 バージョン 3.0対応 メタデータ 収集・蓄積 ① junii2 バージョン3.0のデータ項目が入力可に (2013.7学位論文関係データ項目対応済) A大学 メタデータ (junii2 ) IRDB B大学 メタデータ (junii2) C大学 メタデータ (junii2) ②junii2 バージョン 3.0出力設定(2014.1予定)
6.おわりに
おわりに 機関内だけで悩まないで、コミュニティに相談しま しょう。みんな同じような経験を積んでいます。 JAIRO Cloudコミュニティサイト https://community.repo.nii.ac.jp/community/ DRFのサイト http://drf.lib.hokudai.ac.jp/drf/