研究データ管理 図書館ができること・すべきこと 機関リポジトリ推進委員会 大園 隼彦
大学図書館は研究データ管理の何ができるのか? どのように保存するのか? ワークフロー、ストレージ、フォーマット どのように公開するのか? メタデータ、保存範囲、保存期間 どのように有効活用できるのか? メリット 研究者の疑問は様々あると思う。 その答えを明確に示すことができればよいが、大学図書館は現在手探り状態。 この機会に研究者の意見を把握して、適切なサービスを構築してきたいと考えている。 図書館に求められていること → 現在図書館でできていること → 今後図書館でやろうとしていること(近い) → 図書館がすべきこと(遠い) について、私見も交えて紹介することで、今後の議論になれば良い。
学術情報のオープン化の推進について(中間まとめ) 大学等に期待される取組 ・ 機関リポジトリをグリーンOAの基盤としてさらに拡充すること ・ オープンアクセスに関わる方針を定め公表すること ・ 研究者のデータ管理計画の作成と計画に従った管理の実施について支援する。 ・ 研究データの保管に係る基盤を整備するに当たって、情報基盤の共有や効率的な整備の観点 から、アカデミッククラウドの活用を図る。 ・ 論文、研究データの管理に係る規則を定め、研究成果の散逸、消滅、損壊を防止するための 施策を講ずる。 ・ 論文、及び研究データに永続性のあるデジタル識別子を付与し管理する仕組みを確立する必 要があり、JaLCの活動と連携し進める。 ・ 引用されたデータ作成者の貢献を業績として評価する。 ・ 技術職員、URA及び大学図書館員等を中心にデータ管理体制を構築し、研究者への支援に資 するとともに、必要に応じて複数の大学等が共同して、データキュレーター等を育成するシ ステムを検討し、推進する。 ・ 特に、大学図書館には、機関リポジトリの構築を進めてきた経験等から、研究成果の利活用 促進の取組に積極的な役割を果たすことが期待される。このため、大学の当該領域に関連す る研究科等において、大学図書館職員等を対象にデータキュレーター等を育成するプログラ ムを開発し、実践的に取り組んでいく。 まずは大学図書館に何が求められているかを見る。 今年の3月に内閣府より「我が国におけるオープンサイエンス推進のあり方について」が出され、続いて 今年の9月に文科省の科学技術学術審議会・学術分化会・学術情報委員会から、「学術情報のオープン化の推進について」が出されている。 そこでは、国、研究資金配分期間、学協会、大学等の様々なステークホルダーに対して提言がなされている。 各ステークホルダーが協力して進める必要が有る。 ここでは特に大学図書館が関係すると思われる「大学に期待される取り組み」と「NIIが行うべき取り組み」に注目する。 図書館はキュレーターになることを求められている。但し、キュレーターの役割も分野によって様々ではないか。 ジェネラルな部分だけを担うのか? http://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu4/036/houkoku/1362564.htm
学術情報のオープン化の推進について(中間まとめ) NIIが行うべき取組 ・ 機関リポジトリ構築の共用プラットフォーム(JAIRO Cloud)により、大学等における効率 的な整備を支援する。 ・ 国際学術情報流通基盤整備事業(SPARC Japan)によりセミナーを開催するなど、オープ ンアクセスに対する理解増進を図る。 ・ アカデミッククラウドの構築に当たり、フォーマットの標準化やシステム開発及び共同調達 等について、大学等と連携し進める。 ・ JST等と連携して、論文に加え、各データベースや各機関のリポジトリ等に登載されている 研究データの横断的な検索・利活用を可能とするための基盤の整備を行い、サービスを提供 する。 研究成果の利活用促進、研究の透明性確保、重複を避けることによる効率性の確保 → 論文のエビデンスとしての研究データの公開。 インフラの整備、人材の育成等図書館が積極的に関わることが期待されている。 再利用の検索サービスの整備。 では具体的にどうしているのか、そして今後どうする必要があるのか? http://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu4/036/houkoku/1362564.htm
IRDB 機関リポジトリのデータの内訳 機関リポジトリの研究データの現状。植物標本の画像データが大半。 ノウハウはまだない。これから蓄積しようとする段階。 http://id.nii.ac.jp/1280/00000139/
機関リポジトリ推進委員会 オープンサイエンス班の取組 OAポリシーの策定支援ツールの開発 RDMトレーニングツールの開発 研究データ対応メタデータスキーマの検討 ケーススタディによる研究データ管理ノウハウの蓄積 推進委員会 : 学術情報流通に関する以下の現況認識と 将来展望に基づき,戦略的重点課題を定め,機関リポジト リの一層の推進を通じてこれらの解決に取り組む。 3つのコミュニティに分散していた部分があるので、それを解決することを目的。 新協議会の重点目標 ・オープンサイエンスを含む学術情報流通の改善 ・リポジトリシステム基盤の共同運営と 有効活用 ・リポジトリ公開コンテンツのさらなる充実 ・担当者の人材育成のための研修活動 ・国際的な取組みに対する積極的連携 推進委員会の取組を見ることで現在の大学図書館のRDMに対する取組が分る
OAポリシーの策定支援ツールの開発 「平成27年5月に京都大学がOAポリシーを策定した が、他大学にもポリシー策定が拡がることが期待され る。本テーマではポリシー策定の支援ツールを開発す る。 具体的には京都大学や海外大学等の先進事例の 情報収集・分析を行い、ポイントを抽出する。またJST、 JSPS等の公的研究助成機関へのヒアリングも積極的 に行い、その結果もツールに反映させる。 平成27年度は支援ツールの素案を作成する。 」 制度と空気の両輪が必要。 平成27年5月に京都大学がOAポリシーを策定したが、他大学にもポリシー策定が拡がることが期待される。 11月には筑波大学も策定。 本テーマではポリシー策定の支援ツールを開発する。具体的には京都大学や海外大学等の先進事例の情報収集・分析を行い、ポイントを抽出する。 またJST、JSPS等の公的研究助成機関へのヒアリングも積極的に行い、その結果もツールに反映させる。 http://www.kulib.kyoto-u.ac.jp/uploads/oapolicy.pdf http://www.tulips.tsukuba.ac.jp/lib/sites/default/files/attach/Univ.ofTsukuba-OA-Policy-j.pdf
RDMトレーニングツールの開発 「海外ではRDMRoseやMANTRA等、研究データマネジメ ントのスキルを身につけるためのトレーニングコースが 数多く存在する。 今年度はその調査を広く行う。その多く は海外での研究助成の申請時に提出を義務付けられて いるDMP(Data Management Plan)への対応を前提とし ているため、 申請システムの異なる日本にそのままの形 で適用できるわけではない。しかしデータの取り扱い方 法など参考になる部分も多く、 その調査結果を基に日本 向けのデータマネージメントのトレーニングツールの開 発を目指す。 平成27年度は調査を実施・分析し、必要であれば翻訳 等も行い、基本設計までを行う。 」 欧米では、公的助成による研究では、研究計画中にDMPを含めることが一般的となっている。 DMP対応のためのサービスが図書館の業務となっているケースも多い。RDMRoseやMANTRA等、研究データマネジメントのスキルを身につけるためのトレーニングコースが数多く存在する。 今年度はその調査を広く行う。その多くは海外での研究助成の申請時に提出を義務付けられているDMPへの対応を前提としているため、申請システムの異なる日本にそのままの形で適用できるわけではない。 しかしデータの取り扱い方法など参考になる部分も多く、IR推進委員会では上述の調査結果を基に、日本向けのデータマネジメントのトレーニングツールの開発を目指す。 現時点では、わが国でDMPがいつ導入されるかどうかはわからないが、今のうちから欧米における実践例の調査もすすめたい。 http://rdmrose.group.shef.ac.uk/ http://datalib.edina.ac.uk/mantra/
RDMトレーニングコースの比較 図書館員が最低限すべきこと ポリシー策定、データサイクルの理解、データ管理計画支援、ケーススタディ、保存、記述、データ共有等がテーマ Sarah Jones, “Content and coverage of Research Data Management courses” よりスライド引用
研究データ対応メタデータスキーマの検討 研究データへのDOI登録実験プロジェクト 「研究成果の流通のためには、メタデータおよび識別 子は極めて重要である。しかし特に研究データのメタ データは、海外事例などをみても多様で複雑である。 まずは国内外の研究データ用のメタデータスキーマを 我が国の事情にあわせて整理し、junii2のスキームで どのように扱うかを検討し、 最終的には図書館員向け の運用マニュアルの整備およびjunii2の拡張案提案を 行う。 具体的には図書館員が扱う可能性が高いJaLC のメタデータスキーマに焦点を絞り検討をすすめる。 平成27年度中にJaLC対応のための提案を策定する。 」 研究成果の流通および管理のためには、メタデータおよび識別子は極めて重要である。 前述のとおり、国内外の研究データ用のメタデータスキーマを整理し、junii2のスキームでどのように扱うかを検討し、最終的には図書館員向けの運用マニュアルの整備およびjunii2の拡張案提案を行う。 具体的には図書館員が扱う可能性が高いJaLCのメタデータスキーマに焦点を絞り検討をすすめている。 Dataciteの必須項目に対応することで、最低限データを引用する際の情報は提供することできる。 しかし、データの発見性の向上についてはそれ以上の情報を提供する必要がある、たとえば、DCCには分野ごとのメタエータスキーマを紹介しているが、それに対応するにことは可能なのか? https://japanlinkcenter.org/top/doc/JaLC_tech_rd_guideline_ja.pdf http://www.dcc.ac.uk/resources/metadata-standards
ケーススタディによる研究データ管理ノウハウの蓄積 1.DNaviデータセット調査 2.論文付随データ 3.データジャーナル ケーススタディとして、すでに各機関で進められている事業について分析し、研究データ管理のノウハウを検討するものである。 今年度は、i) DNaviデータセット調査 ii) 論文付随データ iii) データジャーナルについての調査を行っている。 Dnaviのデータから既にデッドリンクになっているデータベース、今後維持管理が困難なデータベースを対象に実際に機関リポジトリでデータ管理を試み、ノウハウを蓄積する。
岡山大学学術成果リポジトリ ー 三朝温泉地の気候について ー 岡山大学のリポジトリにも一部データらしいものが登録されている。 三朝地区の気温の観測データが。ただしPDFデータ。 第2報(1966年)~第26報(2003年)まで。但し粒度は様々。岡大三朝医療センター研究報告(紀要)に掲載されていたため、PDF形式で公開。DOIは付与されていない。 観測データの場合、どういう区切りで登録するのか問題になると思われる。紀要の一部なので、研究データとしてではなく、文献としてDOIを付与することになる。
DRFオンラインワークショップ 「研究データから研究プロセスを知る」 研究者が実際にどのような研究プロセスで研究を行い、その過程でどのようなデータを扱っているのか、図書館職員は実はよく知らない 様々な分野の研究者に研究プロセスの各段階でどのようなデータを集めているのか詳細に聞き取り、分野ごとに事例集を作成することで、今後研究データを扱おうとする際の参考資料にする 1班:自然科学系 2班:人文・社会科学系 3班:生命科学系 4班:理工・情報科学系
データ管理に関わる様々な要因 DCCのイベントで示された研究プロセスとデータ管理に関わる様々な要因の例 日本でも同様もプロセスで進むとは思われるが、関わっていないので実際にはよく分からない。 分野によって違いもあるだろう http://www.nii.ac.jp/csi/openforum2015/
329のデータセットを公開(2015年11月時点)
引用情報を提示
データ発見可能性の向上に向けて 各データリポジトリに登録されたデータを集約し、発見可能性を高める取組み research data Australia はオーストラリア国内の研究データを集約するサービス。 Australian national data service が提供している。 UK Research Data Discoveryは、 ・イギリスの研究データのディスカバリを改善。 ・9つの大学と9つのデータセンターを統合検索 ・メタデータスキーマはRIF-CS(Registry Interchange Format – Collection and Services Research Data Australiaと同一) ・ORCAソフトウェア(Research Data Australiaと同一)でテスト。 https://researchdata.ands.org.au/ https://www.jisc.ac.uk/rd/projects/uk-research-data-discovery 各データリポジトリに登録されたデータを集約し、発見可能性を高める取組み Research Data Australia のメタデータスキーマはRIF-CSを利用 UK research data discoveryはResearch Data Australiaを参考に構築中
リポジトリのデータを集約する流れ 日本では既に機関リポジトリコンテンツを集約するIRDBシステムある 機関リポジトリ → IRDB → CiNii CiNiiがResearch Data Australia や UK Data Service と同等のサービ スを提供するのではないか。 Junii2をJaLC(DataCite)対応に http://www.nii.ac.jp/irp/archive/system/irdb_harvest.html
分野にリポジトリがないケース DOI JaLC メタデータ 登録 機関 リポジトリ データサービス (CiNii?) 機関 リポジトリ リンク 分野にリポジトリがないケースでは、機関リポジトリに登録する。 機関リポジトリに登録したデータは、IRDB経由でJaLCへメタデータを登録しDOIを取得する。 また同様に、IRDB経由でCiNiiへとメタデータを登録することで、各機関の研究データを集約することができる。 機関 リポジトリ 機関 リポジトリ 機関 リポジトリ
分野にリポジトリがあるケース 分野 リポジトリ JaLC 機関 リポジトリ データサービス (CiNii?) 機関 リポジトリ 機関 一般的に、分野の専用リポジトリが存在する場合は、それを利用することが進められている。 しかし、分野によってはDOIの付与に対応していないところがあるのではないか、これから対応するにはコストはかかるかもしれない。 また、国内のデータを集約するサービスを構築する場合は、各分野ごとにデータサービスへの登録を対応する必要がある。 機関 リポジトリ 機関 リポジトリ 機関 リポジトリ
分野にリポジトリがあるケース 分野 リポジトリ JaLC 機関 リポジトリ データサービス (CiNii?) 機関 リポジトリ 機関 分野リポジトリと機関リポジトリの双方にデータを登録することで、既存のシステムを効果的に利用し、DOIの付与、国内の研究データの集約が可能。 機関 リポジトリ 機関 リポジトリ 機関 リポジトリ
研究データ管理を省力化するには 例)Bristol Univ. ① データ管理はResearch Data Storage Facilityで行う。 ② 公開を希望するデータセットは”Data Bris”フォルダへコピーする。 コピーされたデータセットはデータリポジトリへ転送される。 ③ リポジトリに登録されたデータセットのメタデータを記述する。 記述する項目 Title, Alternative Title, Description, Language, Publisher, Date, Identifiers, Subjects, Data steward, Creator, Contributor, Reference ④ 登録されたデータセットにDOIが付与される ブリストル大学ではエコシステムができつつある。 独自開発されたResearch Data Storage Facilityではデータ管理責任者に5TB までストレージが割り当てられる。 日常的なデータ管理はこのストレージ上で実施する。データが公開できる段階になると、データ公開用のフォルダにデータをコピーするだけで、データリポジトリに登録可能。その後、データリポジトリでメタデータを記述し、DOIを付与することでデータセットが公開できる。 データライブラリアンがメタデータのチェックを行い、datacite経由でDOIを登録(メタデータスキーマはDataciteに対応) ブリストル大学ではメタデータの付与も研究者が行っている。ある程度のマニュアルを作成すると図書館員でも可能になるかもしれない。 しかし、readmeファイルでデータの内容や再利用の方法についての記述は必要か。 アカデミッククラウドなるものが、この機能を備えるようになるのか? ブリストル大学のデータセット数は178(2015/12/1) http://data.bris.ac.uk/files/2014/03/Depositing-guide.pdf
国内のエコシステムはどうなる? ・ 研究データの保管に係る基盤を整備するに当たって、情報基盤の共有や 効率的な整備の観点から、アカデミッククラウドの活用を図る。 ・ アカデミッククラウドの構築に当たり、フォーマットの標準化やシステ ム開発及び共同調達等について、大学等と連携し進める。 アカデミッククラウドに期待? 入り口と出口のデザイン (closed と open の架け橋に) 学内外のステークホルダーと協力して構築する必要がある。 業績システムの見直し。URAとの協力。(紀要編集委員会の協力。) リポジトリコンテンツへのDOI付与、ORCIDへの業績の集約、researchmapとの連動、学内の業績システムとの連動 など、機関リポジトリをハブに各種システムがシームレスにつながるかも
Disciplinary Metadata - 各分野ごとに対応できるのか - 再利用を進めるには分野特有のメタデータをきちんと記述することが大切だが、図書館員には難しい。仮にサブジェクトライブラリアンがいたとしても細分化された分野すべてに対応するのは難しいのではないか。 記録レベル用語は記述できるかもしれないが、出現クラス、イベントクラス、位置クラス、地質コンテキストクラス、識別クラス、分類群クラスは、データ収集でなくては記述は難しいと思われる。 「図書のような」記録(たとえばreadmeファイル)があれば当てはめることはできるかもしれない。 各分野のCurator(データの管理 = 若い研究者)と図書館員(データの保存・公開)が協力すること。 データが研究のベースになるのならば、若い研究者はデータ管理を経験すべきなのでないか。 若い研究者がcuratorとしてデータをきちんと管理する。 それを二次利用できる体制を整備し、データの引用という形で業績に繋がれば良いのではないか。図書館はこの体制がスムーズにまわるようにお手伝いできると思う。 データジャーナルはこのシステムの中にうまく組み込めるか、しかしデータジャーナルが向いている分野、向いていない分野があるのではないか。 Darwin Coreを抜粋 http://www.gbif.jp/v2/datause/data_format/index.html
大学でデータジャーナルを作る選択肢はあるか? 公的研究成果のデータは公開する 再利用できるようメタデータを付与する データの質を保証する 機関リポジトリで最低限のメタデータを付与して公開するだけでは利用し難いのではないか データジャーナルを作った方が確実?? 図書館員が関与できる メタデータの整備、DOIの付与、保存場所の確保、相互運用性を考慮、 +事務手続き? データの中身の判断はどうする? ジャーナルの査読はどうする? 図書館は新しいメディアの編集にどう関与していくのか? 機関リポジトリを用いた現状の踏襲ではオープンサイエンスの要件は満たせないのではないか? ならば学内でデータジャーナルを発行してはどうか? そのプロセスに図書館がどのようにかかわるのか、図書館が新たなメディアの編集に関わることができるのか? サブジェクトライブラリアンを育成できるのか、データライブラリアンを育成できるのか、もしくは研究者と密接に協力関係を築くことで解決をはかるのか 今後の図書館の可能性に大きく作用すると思われる。
ありがとうございました。 oozono-h@adm.okayama-u.ac.jp