JAIRO Cloud移行相談会における基本事項説明 2019年5月30日 東京大学情報システム部 前田 朗 ※ 2018年度オープンアクセスリポジトリ推進協会JAIRO Cloud運用作業部会作成の資料をベースに改訂 オープンアクセスリポジトリ推進協会 人材育成作業部会
1.概要
全体フロー リリース日 JPCOAR参加 JC利用検討 JC利用申請 事前周知 周知 外部連携 メタデータ設計 移行データ 抽出 テスト移行 本移行 サイトデザイン
作業分担モデル リリース日 JPCOAR参加 JC利用検討 JC利用申請 事務担当 関係者検討・了承 事前周知 周知 外部連携 メタデータ設計 移行データ 抽出 システム担当 テスト移行 本移行 サイトデザイン
スケジュールの策定 「事務手続き」と「システム構築」からなる リリース予定日から逆算する 事務手続きにかかる時間を考慮する JAIRO Cloud申請後、環境提供まで2か月 データ抽出には1日 データ登録は500件/時程度 残りをメタデータ設計やデータの整備等に 事務手続きにかかる時間を考慮する 学内の委員会等の開催時期 関係者による検討・確認のための時間の確保 ユーザーやコンテンツ提供元への周知期間
DSpaceとJAIRO Cloudの違い メタデータ Dubline coreを限定子で拡張 アイテムタイプごとにメタデータ設計。Dubline Core/junii2には設定でマッピング 統計 (手を入れていなければ)クローラーからのアクセスを統計にふくむ JAIRO Clawler-Listによるクローラーの排除 アイテム詳細画面 もっとも詳細なメタデータ表示がDubline Core形式 メタデータ設計によりアイテム詳細画面の表示項目を制御。一覧形式と目次形式の2パターンあり。 ファセット検索 あり 必要があればインデックスで実現
JPCOARスキーマと 次期JAIRO Cloud 現状で気にしすぎることはないはず すぐJPCOARスキーマ対応するわけではない 次期JAIRO Cloudは2020年度以降の本運用の予定 JAIRO Cloudの対応詳細についてまだ情報がない あえて準備するなら 移行を機に現状のメタデータを整備しておく JPCOARスキーマで使えそうな情報を項目として切り出してお く(「博士論文」「修士論文」「卒業論文」の別など) 参考情報 ・JPCOARスキーマ説明会資料 http://id.nii.ac.jp/1458/00000032/ ・JPCOARメタデータ普及タスクフォース問い合わせ先 irtf_metadata#nii.ac.jp (#を@に読み替えてください)
2.事務手続き
手続きフロー 参加機関 JAIRO Cloud事務局 フローには書ききれないが、データ移行と並行し、 移行受付相談 相談対応 学内協議・参加申請 申請受理 環境構築・ML登録 データ移行 データ移行完了報告 アクセス制限解除 (ハンドルシステム切り替え) 公開 コミュニティサイト登録 IRDB連携 外部データ提供先に変更通知 ※「2-2.JAIRO Cloudの手続きと最新機能」(http://id.nii.ac.jp/1038/00000181/)の図を一部修正 フローには書ききれないが、データ移行と並行し、 機関内で使用する機能の選定や、細部の詰め、周知などがありえる
JAIRO Cloud利用検討 メリットの文例 1.経費の節減 2.セキュリティの確保 3.機能の向上 現在の定常運用経費が概算で年間xxx万円のところ、JAIRO Cloudであればxx万円で済む。定常運用経費以外にも臨時で 改修経費がかかることがある(xxx年には約xx万円支出)。また、経費としては挙がらないが、調達やインシデント対応 など職員の人的コストがかかっている。JAIRO Cloudであれば、これらのコストが利用料金に含まれることになる。 2.セキュリティの確保 (1)セキュリティの専門家による保守 JAIRO Cloudではサーバの監視やセキュリティに関する保守を専門業者が行っている。現在の職員による対応よりも専門 家に任せたほうが安全である。 (2)リポジトリソフトウェアのバージョンアップサービス 現在、機関リポジトリで使用しているリポジトリソフトDSpace ver 1.xはすでに大元の開発元のサポートが終了している。 数年に一度のリプレイスではバージョンアップとそれに伴うサポート期限への対応が難しい。JAIRO Cloudに乗り換え、 そのリポジトリソフトWEKOを随時バージョンアップしてもらうほうが安全である。 3.機能の向上 (1)ユーザーインターフェイスの向上 DSpaceの不満点として、文献リストの表示にソート条件指定が必要、文献詳細情報ページがDubline Coreメタデータス キーマ表示になっているなど、インターフェイスがわかりづらいことが挙げられる。JAIRO Cloudではより洗練されたイ ンターフェイスでの文献の閲覧が可能である。 (2)国内事情に合わせた機能の追加 JAIRO Cloudが採用しているリポジトリソフトWEKOは、国内の図書館員の意見を受け入れ、国立情報学研究所にて随時 機能強化が行われている。そのため、国内の事情に合わせた機能を使うことができる。具体的には、ジャパンリンクセ ンターのDOI自動採番機能、共用クローラーリスト”JAIRO Clawler-List”による標準的な利用統計の取得、日本のナレッジ ベースであるERDB-JPとの連携機能などが挙げられる。将来的にもResarchmap掲載論文をもとにした機関リポジトリ掲 載候補論文の提示など、先端的な機能の追加が期待できる。
あえてデメリットをあげると リプレイス及びWEKOの学習に労力がかかる カスタマイズがWEKOの設定の範囲内でしかで きない。システム改修要望はJAIRO Cloud全体に とって利益があるかという観点で採否が決まる。
JAIRO Cloud参加申し込み JPCOAR未加入の場合、加入が必要 JAIRO Cloud参加申し込みが必要
機関内での細部詰め 作業の外注化 セルフアーカイビング対象者の扱い 登録ユーザ(アイテム統計、新着通知)の扱い 移行後のDOIの一括登録 ERDB-JP参加 CNRI Handleの継続有無 雑誌の表示形式(一覧 or 目次形式) PDFカバーページ
周知と外部連携先連絡
事前周知 一般ユーザ 登録ユーザ 学内刊行物提供元 学内関係部署 それぞれについて周知を考える 東京大学の一般ユーザ向け周知の例 論文別アクセス統計 博士論文及び学内刊行物へのDOI付与 新着コンテンツ情報 トップページのURL変更
周知 JAIRO Cloudリリース後のWebニュース 「公開」と合わせて、CiNii やIRDBからのリンクが新リポジトリに切り替わるまで時間がかかることのアナウンスも
学術機関リポジトリデータベース変更手続き リポジトリリプレイス後にトップページURL・OAI-PMH Base URLなど変更手続きを行う https://support.irdb.nii.ac.jp/ja/application/irdb より抜粋 連絡担当者以外の変更の場合 利用機関情報管理システムにログインください。 「申請一覧」タブを開き、変更したいIRDB申請の詳細画面を開きます。 「編集」ボタンをクリックしてください。 申請区分を「変更」とし、変更箇所を修正のうえ、「保存」ボタンをクリックしてください。 保存後、「申請」ボタンから申請をお願いします。 変更手続の完了後、「IRDBの変更申請手続が完了しました」という件名のメールが届きます。
CNRI事務局への連絡 (CNRI Handle利用の場合のみ) JAIRO Cloudリリース直後、JAIRO Cloud事務局の情報をもとに変更依頼を出す
OpenDOAR等の連携先に連絡 東京大学では投稿フォームから修正依頼を出した http://www.opendoar.org/feedback.php Subject OpenDOAR Feedback: Repository of the University of Tokyo (OpenDOAR ID 914) is changed Mesages: We are system managers of institutional repository of the University of Tokyo (UTokyo Repository) which OpenDOAR ID is 914. UTokyo Repository is replaced on 2017/10/02. Please update information of UTokyo Repository as follows. Repository Name: UTokyo Repository Repository URL: ※ OAI-PMH: http://repository.dl.itc.u-tokyo.ac.jp/oai Software: WEKO ※ We inform you new repository URL at next mesasge
3.構築編
構築のフロー アイテム・インデックス サイトデザイン・機能設定 データ移行と並行で構築を進めることが可能 ※「JAIRO Cloudへの移行の手引き」(http://id.nii.ac.jp/1038/00000142/) より サイトデザイン・機能設定 データ移行と並行で構築を進めることが可能
アイテム・インデックス移行
データ抽出 国立情報学研究所提供のデータコンバータでデータ抽出 DSpaceサーバからコマンドラインで実行 $ perl output2weko.pl dspace ./param.ini 2017/11/01 15:28:50 [INFO] 処理開始 2017/11/01 15:28:51 [INFO] 処理対象データは 295 件あります。 2017/11/01 15:28:51 [WARNING] コミュニティ・コレクション名にWindowsで使用できな い文字が含まれていたので変換しました。[Language, Information, Text = 言語・情報 ・テクスト : 東京大学大学院総合文化研究科言語情報科学専攻紀要] -> [Language, Information, Text = 言語・情報・テクスト : 東京大学大学院総合文化研究科言語情報科 学専攻紀要] 2017/11/01 15:28:51 [WARNING] コミュニティ・コレクション名にWindowsで使用できな い文字が含まれていたので変換しました。[Working Paper Series / UTokyo Price Project] -> [Working Paper Series / UTokyo Price Project] 2017/11/01 15:28:52 [WARNING] NII資源タイプが設定されていないか、もしくは設定値 に誤りがあるためWEKOアイテムタイプを出力できませんでした。ITEM_KEY:88072 2017/11/01 15:28:54 [WARNING] コミュニティ・コレクション名にWindowsで使用できな い文字が含まれていたので変換しました。[Eruditi : The CGCS Journal of Language Research and Education] -> [Eruditi : The CGCS Journal of Language Research and Education] 2017/11/01 15:28:55 [INFO] 295 / 295 件処理しました。 2017/11/01 15:28:55 [INFO] 処理終了
データコンバータ設定 設定ファイル”param.ini” (ポイントとなる設定のみ抜粋) NIItype設定ファイル”typenii.txt” (東京大学の例から抜粋) ;--------------------------------------------------------------- ; 共通パラメタ ; 出力データ格納先(未指定の場合は./outdata) out-dir = ./outdata ; メタデータ(metadata.tsv)のみを出力する (未指定の場合は0) ; 1:メタデータのみを出力する ; 0:一次データファイルの出力(コピー)も行う ;only-metadata = 0 only-metadata = 1 ; 出力したファイルを圧縮する(YES:する NO:しない)(未指定の場合はYES) ;compression = YES compression = NO ; DSpace用パラメタ [dspace] ; データベース接続ユーザID db-user = xxxx ; データベース接続ユーザパスワード db-password = xxxx ; データベース名 db-name = xxxx ; 本文データ格納先ディレクトリ名 fulltext-dir = /opt/dsk/system/dspace/assetstore ; NII資源タイプのメタデータタグ名 niitype-field = dc.type.none Journal Article 学術雑誌論文 / Journal Article Jounal Article 学術雑誌論文 / Journal Article Thesis 学位論文 / Thesis or Dissertation Departmental Bulletin Paper 紀要論文 / Departmental Bulletin Paper Departmentarl Bulletin Paper 紀要論文 / Departmental Bulletin Paper Departmental bulletin Paper 紀要論文 / Departmental Bulletin Paper Conference Paper 会議発表論文 / Conference Paper Conforence Paper 会議発表論文 / Conference Paper Presentation 会議発表用資料 / Presentation Book 図書 / Book Book chapter 図書 / Book Rare Book 図書 / Book Technical Report テクニカルレポート / Technical Report Discussion Paper テクニカルレポート / Technical Report Working Paper テクニカルレポート / Technical Report Research Paper 研究報告書 / Research Paper Research paper 研究報告書 / Research Paper Article 一般雑誌記事 / Article Preprint プレプリント / Preprint Learning Material 教材 / Learning Material Learning Object 教材 / Learning Material ※DSpace上での入力ミスを設定で対処
メタデータの設計 NII提供のサンプルをベースに作成する 東京大学のフィルタ設定初期案抜粋 ※ 後日にわかったことだが、Google Scholar対応には、「タイトル」と「著者」は日英をわけて値を設定したほうがよい
フィルタ設定画面例
データをチェックする際のポイントなどは、参考資料を参照 データ加工 抽出したデータを確認、整理する ・TSVファイル(タブ区切りのテキストファイル)の形式でデータが抽出 される。 ・一括登録する前に、Excelなどからデータを修正することができる。 ※一括登録で読み込ませるデータの形式は 、TSVファイルだけでなく、 Excelファイル(*.xlsx)も対応している。 データをチェックする際のポイントなどは、参考資料を参照
WEKOへのデータロード SCfW変換フィルタ編集マニュアル(移行機関向け) 移行用データ変換ツール NII フィルター 提供 作成 FilterEditor 移行するアイテムのメタデータファイル 編集 フィルター SCfW・データコンバータ コンテンツデータを変換 インポートファイル(.zip) 一括登録 JAIRO Cloud SCfW変換フィルタ編集マニュアル(移行機関向け) (http://id.nii.ac.jp/1038/00000147/)より
ロット分割とワークシート 件数が多いときは「サーバが無効な応答」を返す リスクが高いためロット分割を推奨。 http://id.nii.ac.jp/1038/00000148/ ロット分割とワークシート 件数が多いときは「サーバが無効な応答」を返す リスクが高いためロット分割を推奨。 東京大学では1000件で1ロットにした ロット分割をしても途中でエラーになることがあ る。更新用メタデータからWEKO_URLがない(未登 録の)レコードのみ切り取ってそれを登録にかけ る 作業ミスを防ぐために国立情報学研究所提供の ワークシートを活用したい http://id.nii.ac.jp/1038/00000148/
インデックス設定 「英語」名を必要に応じ記入 RSSで新着情報を提供する場合は、チェック PDFカバーページを使う場合はチェック インデックスにコメントや画像を入れたい場合は「目次形式」をチェック。ただし、インデックス内のアイテム数が多いと扱えない
サイトデザイン・機能設定
画面デザイン Before(イメージ) After(イメージ)
機能設定 設定項目の例 ログイン > WEKO[編集] > [管理] 表示設定 初期表示画面設定 言語選択表示設定 ランキング管理 検索設定 検索結果表示設定 運用設定 PDFカバーページ設定 外部著者ID Prefix編集 WEKO検索キーワードメタデータ表示
4.役立ち情報
CNRI Handleは移行できますか。 JAIRO Cloud利用申請時に、CNRI Handleの 継続使用をお申込ください。一括登録前 のメタデータ項目の設定や、WEKOへCNRI のPrefix設定、JAIRO Cloud環境の一般公開 後にCNRIとの契約変更手続き等が必要と なります。
紀要など同一巻号掲載論文を全て登録する場合にその目次一覧ページをつくれますか。 WEKOのインデックスの設定で「目次 形式」を選択すると、インデックス 内のアイテムを目次風に表示できま す。この表示設定はインデックスご とに手作業で行います。
学内システムと連携を行いたいです。 JAIRO Cloudでは、OAI-PMH, SWORD, OpenSearchといった外部向けのイン ターフェイスを用意しています。こ れらを活用し連携を行えます。
インデックス内のアイテムを「巻」「号」「ページ」順などで並べることができますか。 一括登録の場合、アイテムは登録メタデータの行 順で並びます。事前に登録用メタデータを「巻」 「号」「ページ」でソートするなど並び順をコン トロールしてください。 WEKO登録後は手作業により一件ずつアイテムの 並び順の変更ができます。その場合はWEKOの 「編集」から「アイテム管理」タブ→「表示順序 設定」で修正ください。(インデックス内のアイ テムが100件以内の場合)
一括登録の際の著者IDの設定方法がわかりません。 WEKOに登録済みの著者ID種別について、著者IDを属性タイ プ"name"のメタデータ項目へ登録できます。メタデータ項 目には以下のとおりセットしてください。 「著者ID種別」:「著者ID」 例: CiNii_ID:100000 研究者リゾルバID:20000 A大学ID:30000 著者IDに設定したURLが表示できます。WEKOの「管理」タ ブの「外部著者IDprefix」「外部WebページURL」を設定し てください。
SWORD Client for WEKOのアイテムタイプ別の設定について効率的な方法はありますか。 WEKOアイテムタイプ別の設定においては、まず ひとつのアイテムタイプについて、設定を行い、 それを他のアイテムタイプ用にコピーして使う 方法があります。また、NIIが提供している各リ ポジトリシステム別のフィルタひな形もご活用 ください。
フィードバックメールの登録を効率化する工夫はありますか。 初めにフィードバックメールを送信したいユー ザーをWEKOの「著者名典拠」に登録します。 その後に、論文の一括登録を行なうと、論文ご とにフィードバックメールが設定されます。 次のメタデータ項目に、著者名典拠に登録した メールアドレスを記載します。 「FEEDBACK_MAIL」