移行機関向け 登録データ仕様 2015 年 1 月 21 日改訂 国立情報学研究所
1. 一括登録データのデータ構造 2. メタデータファイル概要 3. 一括登録用データ項目 4. 著者名典拠
1. 一括登録データのデータ構造 1/2 移行元リポジトリリポジトリ内のメタデータ及び本文ファイルが以下のようなデー タ構造で用意ください。 +-- item001 (アイテム情報を格納するフォルダ) | +-- xxxxxxxx.tsv (メタデータの TSV ファイル) | +-- xxxxxxxxxx (アイテムのユニークキーを名称とするディレクト リ) | +-- 本文ファイル( *.pdf 等) | +-- xxxxxxxxxx (アイテムのユニークキーを名称とするディレクト リ) | +-- 本文ファイル( *.pdf 等) ::: Excel ファイル (*.xlsx) も可
1. 一括登録データのデータ構造 2 /2 メタデータファイルの件数 データ一括登録はメタデータファイルの単位で行 います。件数が大きい場合は、複数に分割して ロードください。推奨は1万件です。 ユニークキー 機関リポジトリのアイテム間で、本文ファイル名 が重複するケースがあります。そのため、アイテ ムのユニークキーを決め、ユニークキーによる ディレクトリ名の下に、本文ファイルを置くよう にしています。 ユニークキーは自由に決めてさしつかえありませ んが、後述のとおりメタデータ中にも記載する必 要があります。
2. メタデータファイル概要
2.1 メタデータファイルの形式 TSV 形式でメタデータファイルを用意ください。 1行目をヘッダ行とし、2行目以降に値をセットしてください。 ヘッダ行には移行元システムのメタデータ項目名を入れます 文字コードは utf8 でお願いします。 ヘッダ行 WEKO のアイテム一覧画面では、先に登録したアイテムが上に表示され ます。
2.2 メタデータファイルの形式 繰り返し上限が決まっているのであれば、同名のヘッ ダ項目を複数用意し、それぞれ値をセットするのでも 可能です。 任意のデリミタ(区切り文字列)により、繰り返し項目へのデータ 登録が可能です。デリミタは 1 文字ではなく「文字列」での使用を 推奨します。 「 」をデリ ミタにしていま す。
2.3 タイトルとタイトル (英) WEKO では [ タイトル ] と [ タイトル(英) ] のどちら かに値が必須です。 [ タイトル(英) ] のみに値がセットされている場合、ア イテム詳細画面、 OAI-PMH とも、それを [ タイトル ] と して扱う [ タイトル ] と [ タイトル(英) ] の両方に値が入っており、 NetCommons の表示言語が [ 英語 ] の場合、アイテム詳細 画面で [ タイトル(英) ] が表示される
WEKO では、メタデータ項目に日付の データ型を指定できます。日付データ型 は以下の形式のデータしか受け付けませ んので、ご注意ください。 YYYY-MM-DD YYYY/MM/DD ※ MM 及び DD の省略不可 2.4 日付形式のデータ
2.5 姓名自動分割 WEKO では、著者名等に name 型のデータ を指定できます。 name 型では、入力データの姓名を自動分 割するか、しないかを設定で決めること ができます。 自動分割ありに設定した場合、以下の条 件で姓名を分割します。 カンマ区切りの文字列 半角空白区切りの文字列
3.1 一括登録用データ項目一覧3.1 一括登録用データ項目一覧 データ項目説明 WEKO アイテムタイプ WEKO のアイテムタイプ指定(必須項目)です。 POS_INDEX 登録コンテンツのインデックスを指定します。 ITEM_KEY 登録コンテンツの本文ファイル( PDF 等)が、どのフォルダにあるかを示 します。 ファイル登録コンテンツのファイル名です。 ITEM_KEY とファイルの組み合わせ で、登録ファイルを指定します。 公開日 WEKO のコンテンツ公開日(必須)です。 FEEDBACK_MAIL 月次の利用統計の送信先メールアドレスを指定します。 CNRI CNIR ハンドル URL を指定します。 SELF_DOI_RA selfDOI の ra を指定します。「 JaLC 」「 CrossRef 」のみ指定可能 SELF_DOI 国立国会図書館の selfDOI を「 prefix 」 / 「 suffix 」形式で記述する。 未入力の場合は、 WEKO が新規発番する WEKO_URL データ一括登録を行うと自動的に、 WEKO_URL 列が追加されます。どの WEKO データ一として登録されたかを示します。一括更新の際のマッチン グキーにもなります。 個々の詳細は次のスライドにて説明をします。
1 / WEKO のアイテムタイプ WEKO は、データの種類に応じたメタデータ設計を行うことができます。このデータの種類を WEKO では「アイテムタイプ」と呼びます。アイテムタイプは、 junii2 の NII 資源タイプ( NIIType) を紐付けて 使いますので、データ移行に際して、最低限でも、お使いの junii2 資源タイプの数だけアイテムタイプ を用意する必要があります。複数のアイテムタイプで同じ NII 資源タイプを使うこともできますが、そ の必要がなければ以下のとおり設定ください。 No WEKO アイテムタイプ NII 資源タイプ 1 学術雑誌論文 / Journal Article Journal Article 2 学位論文 / Thesis or Dissertation Thesis or Dissertation 3 紀要論文 / Departmental Bulletin Paper Departmental Bulletin Paper 4 会議発表論文 / Conference Paper Conference Paper 5 会議発表用資料 / Presentation Presentation 6 図書 / Book Book 7 テクニカルレポート / Technical Report Technical Report 8 研究報告書 / Research Paper Research Paper 9 一般雑誌記事 / Article Article 10 プレプリント / Preprint Preprint 11 教材 / Learning Material Learning Material 12 データ・データベース / Data or Dataset Data or Dataset 13 ソフトウェア / Software Software 14 その他 / Others Others WEKO がデフォルトで持つアイテムタイプと NII 資源タイプ
3.2 POS_INDEX 1/33.2 POS_INDEX 1/3 WEKO では、アイテムを階層化して、ブラウジングが可 能です。この機能を「インデックスツリー」と呼びます。 「インデックスツ リー」で アイテムをブラウジン グ
一括登録の際に、アイテム登録先のインデックスツリーを指定でき ます。移行元のシステムでも階層構造を実現しているのであれば、 その階層名を「 POS_INDEX 」として指定ください。形式は次のと おりです。 3.2 POS_INDEX 2/33.2 POS_INDEX 2/3 階層 1/ 階層 2/ 階層 3 階層 1 階層 2 階層 3 登録アイテム データ形式 (階層の区切りは / で指定) 登録結果 (階層構造はデータ一括登録時に生成されます) ひとつのアイテムを複数のインデックスに登録可能です。その場合は、 POS_INDEX の値を / で区切って指定ください。
POS_INDEX にはデータの制約がありま す。 Shift-JIS サポート外の文字は使用できません POS_INDEX の文字列の長さが長すぎると、 データ一括登録に失敗することがあります。 おおよその目安としては、 100 文字以内とお 考えください。 3.2 POS_INDEX 3/33.2 POS_INDEX 3/3
3.3 ITEM_KEY3.3 ITEM_KEY アイテムの本文ファイルのあるフォルダ名を指定くだ さい アイテム同士のフォルダ名の重複を避けるため、必然 的にアイテムのユニークキーを設定することになりま す。
3.4 ファイル 登録アイテムのファイル名です。 ITEM_KEY と ファイルの組み合わせで、登録ファイルを指定しま す。 ひとつのアイテムに、複数の本文ファイルを登録可 能です。その場合は、ファイル名をデリミタで区 切って指定ください。 複数ファイルを指定する場合は、先に指定したファ イルが、 WEKO のアイテム詳細表示画面で先に表示 されます。 WEKO の File 型データには、ファイル名以外に、ラ イセンス等の指定も可能です。フィルタを設定し、 ご利用ください。
3.5 公開日 「公開日」は必須項目です。公開日に達 していないアイテムは、非公開となりま す。 「公開日」は日付型( Date 型)のデータ です。 2.3 に示した形式のみ受け付けます。
3.6 CNRI3.6 CNRI CNRI ハンドルシステムを使用している場 合、このヘッダ項目にハンドル URL を指 定ください。 JAIRO Cloud における CNRI のハンドル利 用の詳細については、機関リポジトリ担 当にお問い合わせください。
月次の利用統計の送信先メールアドレス を、アイテムごとに指定できます。 利用には、後述の著者名典拠データ登録 及びフィードバックメールの有効化設定 が必要です。 3.7 FEEDBACK_MAIL3.7 FEEDBACK_MAIL
3.8 SELF_DOI_RA3.8 SELF_DOI_RA junii2 における selfDOI メタデータ属性の ra を指定します。 指定可能な文字列は ”JaLC” と ”CrossRef” のみです。 後述の SELF_DOI に値が入っておらず、 DOI 登録の要件を満たしている場合は、 指定の ra で自動で DOI 登録されます。 JaLC 準会員限定
3.9 SELF_DOI3.9 SELF_DOI Junii2 における selfDOI メタデータ項目の 値を指定します。 JaLC 準会員限定
3.10 WEKO_URL3.10 WEKO_URL WEKO が予約しているヘッダ項目です。 一括登録の際に、登録コンテンツの WEKO 上の URL が決まります。この URL を、 WEKO_URL としてメタデータに書 き戻します。 一括更新の際に、 WEKO 上のどのデータ を更新するかを指定するキーとなります。
3. 11 CNRI3. 11 CNRI CNRI ハンドルシステムを使用している場 合、そのヘッダ項目の名称を、「 CNRI 」 に書き換えてください。 JAIRO Cloud における CNRI のハンドル利 用の詳細については、機関リポジトリ担 当にお問い合わせください。
1. 12 その他 WEKO アイテムの設定がないレコードはエ ラーになります。 言語コードは「 3 文字」 (ISO )のみ受 け付けます。「 2 文字」 (ISO )のコー ドは処理されません。また、 「 en-US 」のよ うな指定も行えません。 本文ファイルへの Creative Commons 設定等、 元のリポジトリにないデータ項目の登録を行 うこともできます。メタデータに必要な列を 追加し、それに合わせ SCfW フィルタを設定 ください。
4 .著者名典拠
4.1 著者名典拠データ登録形式 ヘッダ項目 名 姓 メールアドレス 名 ( ヨミ ) 姓 ( ヨミ ) CiNii ID 研究者リゾルバー ID 科研費研究者番号 以下のヘッダ項目をもつ、 utf8 の TSV ファイルでデー タを用意ください。機関独自 ID の場合は、 WEKO で 独自 ID を設定の上、ヘッダ項目を追加ください。
4.2 データ登録 WEKO の画面から、一括登録が可能です。