SCfW変換フィルタ 編集マニュアル 2015年6月10日改訂 国立情報学研究所
はじめに(1/2) フィルタとは SCfWにおけるデータ変換フィルター(以下、フィルタ)とは、 コンテンツデータをWEKOにインポート可能な形式に変換するための ルールを定義したファイル(wdcfファイル)です。 移行対象のメタデータファイル(TSVファイル)に合わせたフィルターを SCfWに設定する事で、移行元の機関リポジトリのメタデータ項目に対応した データ移行が可能になります。 メタデータファイルとは 移行元のリポジトリから、データ変換ツールによって出力されたファイルです。
はじめに(2/2) 一括登録の流れ フィルタの設定はSCfWのFilterEditor機能で行います。 移行用データ変換ツール NII フィルター 提供 作成 FilterEditor 移行するアイテムのメタデータファイル 編集 フィルター SCfW・データコンバータ コンテンツデータを変換 インポートファイル(.zip) 一括登録 JAIRO Cloud
目次 自機関リポジトリのメタデータ確認 フィルタ設定の確認 SCfWフィルタ設定変更
1.自機関リポジトリのメタデータ確認 機関リポジトリシステムでは、メタデータ項目をシステムカスタマイズにより変更が可能です。現在使っているメタデータ項目を漏れなく移行するために、まずは自機関のメタデータ項目を確認ください。
1.1 メタデータファイルの確認 +-- item001 (アイテム情報を格納するフォルダ) | 移行元リポジトリにて、NIIが提供するデータコンバータを実行すると、リポジトリ内のメタデータ及び本文ファイルが以下のようなデータ構造で出力されます。 +-- item001 (アイテム情報を格納するフォルダ) | +-- metadataxx.tsv (メタデータのTSVファイル) +-- xxxxxxxxxx (アイテムのユニークキーを名称とするディレクトリ) | +-- 本文ファイル(*.pdf等) ::: 分割抽出の場合は、数値が入ります
1.2 メタデータファイルのExcel取り込み ※Excelに取り込むにあたり、必ず全ての列を「文字列」として取り込んでください。 メタデータファイル”metadata.tsv”はタブ区切りテキストファイルですが、このままでは内容の確認や、データの修正が難しいため、Excelに取り込んでの利用を推奨します。なお、修正したメタデータファイルは、そのまま上書き保存(移行についてはExcel 形式に対応していないので必ずtsv形式で保存してください)してください。 ※Excelに取り込むにあたり、必ず全ての列を「文字列」として取り込んでください。
1.3 Excel 2013の文字列指定法 Excle 上部メニューの「データ」をクリック 「テキストファイル」をクリック metadataxx.tsvを選択。テキストファイル ウイザードが開く 6.[文字列]にチェックを入れる 5.シフトキーを押したまま、データ項目の左端と右端をクリック 4.[先頭行をデータの見出しとして使用する]にチェック
1.4 メタデータ項目の確認 先頭1列めがメタデータ項目になります メタデータ項目は、元のリポジトリシステムからそのまま抜き出しています。 いくつか、JAIRO Cloud一括登録用に特殊なメタデータ項目名がありますので、次スライドにて説明をします。
1.5 JAIRO Cloud一括登録用データ項目 説明 WEKOアイテムタイプ WEKOのアイテムタイプ指定(必須項目)です。 POS_INDEX 登録コンテンツのインデックスを指定します。 ITEM_KEY 登録コンテンツの本文ファイル(PDF等)が、どのフォルダにあるかを示します。 ファイル(XooNIpsでは項目名がデータ種別ごとに異なります) 登録コンテンツのファイル名です。ITEM_KEYとファイルの組み合わせで、登録ファイルを指定します。 公開日 WEKOのコンテンツ公開日(必須)です。 xxxx_nomalize 日付形式のデータを、WEKOの日付形式(YYYY-MM-DD)に合わせ加工したものです。もとのメタデータ項目のあとに、_nomalizeがつきます。 FEEDBACK_MAIL 月次の利用統計の送信先メールアドレスを指定します。 CNRI CNIRハンドルURLを指定します。(事前にWEKO管理画面でCNRIの設定が必要です) SELF_DOI_RA selfDOIのra属性の新規登録用。既に登録したselfDOIの移行には使えませんので、JAIRO Cloud事務局まで相談ください。 SELF_DOI selfDOIの新規登録用。既に登録したselfDOIの移行には使えませんので、JAIRO Cloud事務局まで相談ください。 WEKO_URL データ一括登録を行うと自動的に、WEKO_URL列が追加されます。どのWEKOデータ一として登録されたかを示します。一括更新の際のマッチングキーにもなります。
1.6 CNRI CNRIハンドルシステムを使用している場合、そのヘッダ項目の名称を、「CNRI」に書き換えてください。一括登録前に、WEKOの管理画面で、「CNRI Prefix」を設定いただく必要がありますので、ご注意をお願いします。 JAIRO CloudにおけるCNRIのハンドル利用の詳細については、機関リポジトリ担当にお問い合わせください。
1.7 注意点 WEKOアイテムの設定がないレコードはエラーになります。 言語コードは「3文字」(ISO-639-2)のみ受け付けます。「2文字」 (ISO-639-1)のコードや 「en-US」のような指定も行えません。また、複数言語の指定も行えません。 本文ファイルにCreative Commons等、抽出データにないデータ項目の登録を行うこともできます。メタデータに必要な列を追加し、それに合わせフィルタを設定ください。
2.フィルタ設定の確認
2.1 NII提供フィルタ 国立情報学研究所では、以下のリポジトリシステムに合わせたフィルタを配布しています。このフィルタをベースに自機関の環境向けのカスタマイズを行ってください。 DSpace (NALIS-R) E-Repository XooNIps DSpaceからJAIRO Cloudに移行される場合は、フィルタのカスタマイズがほぼ必須です。E-Repository, XooNIpsの場合は、機関独自に追加したメタデータ項目があれば、それをフィルタに追加ください。
2.2 NII提供フィルタ設定資料 以下のサイトから確認できます。 https://community.repo.nii.ac.jp/?action=repository_opensearch&index_id=52
2.3 フィルタ設定の確認(「設定項目」) 属性 SCfWでは、メタデータ項目を「属性」と呼びます。 設定項目 下表にて確認ください。不足の属性があれば追加を、不要な属性があれば削除できます。登録した属性は、メタデータ編集画面にて編集可能になります。必須項目以外の属性は検索結果一覧画面やアイテム詳細画面での表示非表示の指定が可能です。 基本メタデータ 属性名「タイトル」「タイトル(英)」「言語」「キーワード」「キーワード(英)」「公開日」の行の メタデータは必須項目であり、削除出来ません。 No 名称 解説 1 属性名 メタデータ名を設定します。 2 属性タイプ メタデータの属性を設定します。選択可能な項目の詳細は「2.4.WEKOの属性タイプ」を参照してください。 3 オプション メタデータのオプション属性を設定します。詳細は「2.5.メタデータ項目のオプション」を参照してください 4 メタデータ変換設定 テンプレートファイルのカラムヘッダー名を設定します。 詳細は「3.4.8.メタデータ変換設定」を参照してください。 5 デリミタ 値を複数入力できるメタデータにおいて値を区切るために使う文字を指定します。 デフォルトは”@@@”が設定されています。 6 候補値(複数可) 選択肢を作成する属性タイプでの選択項目を設定します。 デリミタで区切る事によって複数の項目を設定する事が可能です。 7 マッピング Dublin Core 指定のフォーマットへのメタデータの対応付けを行います。 JuNii2 8 Language type メタデータの表示言語を設定します。
2.4 WEKOの属性タイプ 各属性ごとにデータタイプ(属性タイプ)を指定できます。指定可能な属性タイプは以下の表を参照ください。 No 各属性ごとにデータタイプ(属性タイプ)を指定できます。指定可能な属性タイプは以下の表を参照ください。 No 名称 解説 1 text テキスト 文字の入力が可能なテキスト入力欄です。 2 textarea テキストエリア 文字の入力が可能なテキストです。 改行を使う事が出来ます。 3 link リンク 別サイトへのハイパーリンクです。 リンク名・リンク先URLを設定する必要があります。 リンク名が未記入の場合はリンクURLがそのまま表示されます。 4 checkbox チェックボックス 項目を複数選択が可能なチェックボックスです。 候補値(「3.4.11.候補値」参照)で項目を設定する必要があります。 5 radiobutton ラジオボタン 項目を1つだけ選択可能な選択式のラジオボタンです。 6 pulldownmenu プルダウンメニュー 項目を1つだけ選択可能なプルダウンメニューです。 7 name 氏名 氏名の入力が可能なテキスト入力欄です。 「姓」・「名」・「姓(ヨミ)」・「名(ヨミ)」・「メールアドレス」・「外部著者ID」の情報を設定できます。 8 thumbnail サムネイル サムネイル画像です。 イメージファイルのみ設定する事が出来ます。 9 file ファイル ダウンロード可能なコンテンツ本文ファイルです。 10 file_price 課金ファイル JAIRO Cloudでは使用しません 11 biblioinfo 書誌情報 雑誌情報です。 「雑誌名」・「雑誌名(英)」・「巻」・「号」・「開始ページ」・「終了ページ」・「発行年月日」 の情報を設定出来ます。 12 date 日付 日付情報を設定できます。YYYY-MM-DD もしくはYYYY/MM/DD 形式のみ受け付けます。「年」「月」「日」の省略はできません。 13 heading 見出し 見出しを設定できます。 「見出し」・「見出し(英)」・「小見出し」・「小見出し(英)」の情報を設定出来ます。
2.5 メタデータ項目のオプション JAIRO Cloud上でのアイテムの表示形式やアイテムの登録ルールを設定できます。 No 名称 解説 1 必須 メタデータを必須入力項目に設定します。 この属性の付与されたメタデータが未入力の場合、 アイテムの登録に失敗します。 2 複数可 メタデータに複数の値を持つ事が出来ます。 「課金ファイル」「見出し」にはこのオプションを付与することは出来ません。 3 一覧表示 この属性が付与されたメタデータは、 アイテムが検索された時に、タイトルと同時にメタデータの値も表示されます。 4 改行指定 値が複数存在する場合それぞれの値を改行で区切って表示します。 一覧表示の際も改行指定されたメタデータは改行で区切られます。 5 非表示 設定されたメタデータは一般ユーザーからは見る事が出来なくなります。
2.6 属性タイプと対応カラム 移行元のデータ項目を対応カラム欄に設定できます。また、属性タイプごとの指定可能な値は下表のとおりです。 No 移行元のデータ項目を対応カラム欄に設定できます。また、属性タイプごとの指定可能な値は下表のとおりです。 No 属性タイプ 対応カラム 概要 1 text textarea link checkbox radiobutton pulldownmenu date 属性値 - 2 リンク名 リンクURL 3 name 姓(+名) 名 姓(+名)(ヨミ) 名(ヨミ) メールアドレス 外部著者ID 「姓と名が同じカラム」 姓名を同じカラムに入力するか設定します。 true 「姓(+名)」カラムに姓名をカンマ区切りで入力します。この設定の場合、「名」「名(ヨミ)」カラムは使用する事が出来ません。 false 姓と名を別のカラムに分けて入力します。 4 file file_price ファイル名(パス含む) 表示名 ファイル公開日 flash公開日 CCライセンス 自由記述ライセンス 非会員課金情報(file_priceのみ) 課金情報(file_priceのみ) 選択欄「表示形式」 アイテム詳細画面での表示形式を設定します。 detail ライセンスやダウンロード数などの詳細な情報を表示します。 simple ダウンロードリンクの張られたファイル表示名のみが表示されます。 flash ファイルの内容をフラッシュ形式で表示します。 5 thumbnail ファイル名 6 biblioinfo 雑誌名 雑誌名(英) 巻 號 開始ページ 終了ページ 発行年月日 選択欄「開始ページと終了ページが同じカラム」 ページを同じカラムに入力するか設定します。 「開始ページ」カラムに開始ページと終了ページをハイフン区切りで入力します。 この設定の場合、「終了ページ」カラムは使用する事が出来ません。 開始ページと終了ページを別のカラムに分けて入力します。 7 heading 見出し 見出し(英) 小見出し 小見出し(英)
2.7 [タイトル]と[タイトル(英)] [タイトル]と[タイトル(英)]のどちらかに値が必須 [タイトル(英)]のみに値がセットされている場合、アイテム詳細画面、OAI-PMHとも、それを[タイトル]として扱う [タイトル]と[タイトル(英)]の両方に値が入っており、NetCommonsの表示言語が[英語]の場合、アイテム詳細画面で[タイトル(英)]が表示される
3.SCfWのフィルタ設定変更
3.1 SCfWインストール インストール手順 SCfWのインストール手順については「SCfWクライアントインストールマニュアル」を参照してください。 JAIRO Cloudの環境引渡し時にNIIから連絡する、ユーザーアカウント、パスワード等の設定情報を設定ください。この設定が完了しないと、以降の作業を行うことができません。
3.2 NII提供フィルタのインポート フィルターの配置 JAIRO Cloudコミュニティサイトから、ご利用のシステムに合わせた、SCfWフィルターファイル(*.wdcf)をダウンロードし、以下のとおり配置することでSCfWで使用できるようになります。 Windows Vista/7の場合 C:\Users\[ユーザ名]\AppData\Roaming\SCfW Windows XP/2000の場合 C:\Document and Settings\[ユーザ名]\Application Data\Roaming\SCfW ※[AppData][Application Data]は隠しファイルとなっています。表示されるようにWindowsのフォルダの設定を変更ください。
3.3 起動方法 【SCfW】 1.SCfWを起動します 2.SWORD Client for WEKOのアプリケーション画面が起動したら、アカウントを選択し、自機関のJAIRO Cloudに接続します。(成功すると、「コレクション」の下に”Connected!“のメッセージが表示されます) 3.以下の図のとおり「変換フィルタ」欄右の「選択」ボタンをクリックし、小ウインドウが開いたら「フィルタ管理」を選択します。
3.4 メタデータセット編集
3.4.1 メタデータセット編集 メニュー画面の「メタデータセット編集ボタン」を押下する事で フィルタの編集画面を表示します。
3.4.2 メタデータセット編集画面 メタデータセット編集 メタデータファイルの形式に合うようにフィルターの定義を編集します。 メタデータファイルの形式に合うようにフィルターの定義を編集します。 全ての変更は保存ボタンが押下されるまで確定しません。 アイテムタイプ定義情報 複数のメタデータのセットをアイテムタイプとして定義した情報です。 ① ② ③ ④ No 名称 解説 1 アイテムタイプ選択 編集を行うアイテムタイプ定義情報を選択します。 2 アイテムタイプ アイテムタイプのメタデータの編集を行います。 3 保存ボタン 全ての変更を確定します。 4 キャンセルボタン 全ての変更を取り消してメタデータセット編集を終了します。
3.4.3 アイテムタイプ追加 新しいアイテムタイプ定義情報を追加します。 新しいアイテムタイプ定義情報を追加します。 WEKOのデフォルトアイテムタイプをメタデータの雛形とする事が出来ます。 OKボタンを押下する事でアイテムタイプが作成されます。 No 名称 解説 1 アイテムタイプ名 アイテムタイプ定義名を設定します。 2 基本アイテムタイプ アイテムタイプ定義の雛形となるアイテムタイプを選択します。 WEKOの基本アイテムタイプが選択できます。 ・学術雑誌論文 / Journal Article ・紀要論文 / Departmental Bulletin Paper ・会議発表論文 / Conference Paper ・一般雑誌記事 / Article ・会議発表用飼料 / Presentation ・学位論文 / Thesis or Dissertation ・報告書 / Refresh Paper ・図書 / Book ・図書の一部 / Book ・その他 / Others 3 キャンセルボタン アイテムタイプ定義の追加を行わずに アイテムタイプ追加画面を閉じます。 4 OKボタン アイテムタイプ定義を一時作成します。 メタデータセット編集画面の保存ボタンを押下する事で 作成が完了します。 (一時作成中でもメタデータの編集は可能です。) 押下 ① ② ③ ④
3.4.4 アイテム定義情報編集 アイテムタイプ定義情報のメタデータの編集を行います。 アイテムタイプ定義情報のメタデータの編集を行います。 メタデータセット編集画面の保存ボタンが押下されるまで変更は確定しません。 ① ② ③ ④ 押下 No 名称 解説 1 アイテムタイプ名 編集中のアイテムタイプの名前を表示します。 入力内容を変更する事でアイテムタイプ名の変更が可能です。 2 アイテムタイプ種別 アイテムタイプの論文種別を設定します。 3 アイテムタイプマッピング設定 メタデータ情報を設定します。 4 メタデータ行操作 行追加ボタン メタデータの行を1行追加します。 行削除ボタン 選択したメタデータの行を削除します。 行移動(上)ボタン 1行上のメタデータと順番を入れ替えます。 行移動(下)ボタン 1行下のメタデータと順番を入れ替えます。
3.4.5 基本メタデータ 属性名「タイトル」「タイトル(英)」「言語」「キーワード」「キーワード(英)」「公開日」の行の 属性名「タイトル」「タイトル(英)」「言語」「キーワード」「キーワード(英)」「公開日」の行の メタデータは必須項目であり、削除は出来ません。 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ No 名称 解説 1 属性名 メタデータ名を設定します。 2 属性タイプ メタデータの属性を設定します。選択可能な項目の詳細は「3.4.6.属性タイプ」を参照してください。 3 オプション メタデータのオプション属性を設定します。詳細は「3.4.7.オプション」を参照してください 4 メタデータ変換設定 テンプレートファイルのカラムヘッダー名を設定します。 詳細は「3.4.8.メタデータ変換設定」を参照してください。 5 デリミタ 値を複数入力できるメタデータにおいて値を区切るために使う文字を指定します。 詳細は「3.4.10.デリミタ」を参照してください。 6 候補値(複数可) 選択肢を作成する属性タイプでの選択項目を設定します。 パイプ( | )で区切る事によって複数の項目を設定する事が可能です。 詳細は「3.4.11.候補値」を参照してください。 7 マッピング Dublin Core 指定のフォーマットへのメタデータの対応付けを行います。 JuNii2 8 Language type メタデータの表示言語を設定します。
3.4.6 属性タイプ一覧 No 名称 解説 1 text テキスト 文字の入力が可能なテキスト入力欄です。 2 textarea テキストエリア 文字の入力が可能なテキストです。 改行を使う事が出来ます。 3 link リンク 別サイトへのハイパーリンクです。 リンク名・リンク先URLを設定する必要があります。 リンク名が未記入の場合はリンクURLがそのまま表示されます。 4 checkbox チェックボックス 項目を複数選択が可能なチェックボックスです。 候補値(「3.4.11.候補値」参照)で項目を設定する必要があります。 5 radiobutton ラジオボタン 項目を1つだけ選択可能な選択式のラジオボタンです。 6 pulldownmenu プルダウンメニュー 項目を1つだけ選択可能なプルダウンメニューです。 7 name 氏名 氏名の入力が可能なテキスト入力欄です。 「姓」・「名」・「姓(ヨミ)」・「名(ヨミ)」・「メールアドレス」・「外部著者ID」の情報を設定できます。 8 thumbnail サムネイル サムネイル画像です。 イメージファイルのみ設定する事が出来ます。 9 file ファイル ダウンロード可能なコンテンツ本文ファイルです。 10 file_price 課金ファイル 料金設定が可能なコンテンツ本文ファイルです。 通常の設定ではお使いになることは出来ません。 利用については国立情報科学研究所(NII)にお問い合わせください。 11 biblioinfo 書誌情報 雑誌情報です。 「雑誌名」・「雑誌名(英)」・「巻」・「号」・「開始ページ」・「終了ページ」・「発行年月日」 の情報を設定出来ます。 12 date 日付 日付情報を設定できます。 13 heading 見出し 見出しを設定できます。 「見出し」・「見出し(英)」・「小見出し」・「小見出し(英)」の情報を設定出来ます。
3.4.7 オプション リポジトリ上でのアイテムの表示形式やアイテムの登録ルールを設定できます。 No 名称 解説 1 必須 リポジトリ上でのアイテムの表示形式やアイテムの登録ルールを設定できます。 No 名称 解説 1 必須 メタデータを必須入力項目に設定します。 この属性の付与されたメタデータが未入力の場合、 アイテムの登録に失敗します。 2 複数可 メタデータに複数の値を持つ事が出来ます。 「課金ファイル」「見出し」にはこのオプションを付与することは出来ません。 3 一覧表示 この属性が付与されたメタデータは、 アイテムが検索された時に、タイトルと同時にメタデータの値も表示されます。 4 改行指定 値が複数存在する場合それぞれの値を改行で区切って表示します。 一覧表示の際も改行指定されたメタデータは改行で区切られます。 5 非表示 設定されたメタデータは一般ユーザーからは見る事が出来なくなります。
3.4.8 メタデータ変換設定 メタデータファイルのヘッダー名と、 フィルターのアイテムタイプ定義情報の属性を対応させます。 メタデータファイルのヘッダー名と、 フィルターのアイテムタイプ定義情報の属性を対応させます。 複数のカラムを持つ属性タイプの場合、それぞれ個別に設定が必要です。 アイテムタイプ定義情報の属性名と メタデータファイルのヘッダー名と属性名を対応させます。 複数のメタデータが必要な属性タイプの場合、 それぞれ別のカラム名を設定します。 ※ ヘッダー名と属性名が完全に一致するようご注意ください
3.4.9 属性タイプ毎の設定詳細 No 属性名 対応カラム 概要 1 text textarea link checkbox radiobutton pulldownmenu date 属性値 - 2 リンク名 リンクURL 3 name 姓(+名) 名 姓(+名)(ヨミ) 名(ヨミ) メールアドレス 外部著者ID 「姓と名が同じカラム」 姓名を同じカラムに入力するか設定します。 true 「姓(+名)」カラムに姓名をカンマ区切りで入力します。この設定の場合、「名」「名(ヨミ)」カラムは使用する事が出来ません。 false 姓と名を別のカラムに分けて入力します。 4 file file_price ファイル名(パス含む) 表示名 ファイル公開日 flash公開日 CCライセンス 自由記述ライセンス 非会員課金情報(file_priceのみ) 課金情報(file_priceのみ) 選択欄「表示形式」 アイテム詳細画面での表示形式を設定します。 detail ライセンスやダウンロード数などの詳細な情報を表示します。 simple ダウンロードリンクの張られたファイル表示名のみが表示されます。 flash ファイルの内容をフラッシュ形式で表示します。 6 thumbnail ファイル名 7 biblioinfo 雑誌名 雑誌名(英) 巻 號 開始ページ 終了ページ 発行年月日 選択欄「開始ページと終了ページが同じカラム」 ページを同じカラムに入力するか設定します。 「開始ページ」カラムに開始ページと終了ページをハイフン区切りで入力します。 この設定の場合、「終了ページ」カラムは使用する事が出来ません。 開始ページと終了ページを別のカラムに分けて入力します。 8 heading 見出し 見出し(英) 小見出し 小見出し(英)
3.4.10 デリミタ 複数メタデータ登録可能なメタデータは、 複数メタデータ登録可能なメタデータは、 デリミタで設定した文字(デフォルトは@@@)で値を区切る事で複数入力が出来ます。 @@@ 山田@@@田中 【メタデータファイル】
3.4.11 候補値 選択式の属性タイプの選択肢を設定します。 選択式の属性タイプの選択肢を設定します。 属性タイプ「checkbox」「radiobutton」「pulldownmenu」にて設定が必要になります。 パイプ( | )で区切る事によって複数の項目を入力します。 【WEKO:アイテム登録画面】 メタデータを入力する時は選択肢の項目に一致する値を入力する必要があります。 チェックボックスの場合は複数の値を入力する事が可能です。 【メタデータファイル】