Design of Research Data Services 7. 研究データ管理サービスの設計 第1章で学んだとおり、研究データ管理には多くのメリットがあります。 自機関の研究効率をあげ、研究公正にも寄与するとともに、社会貢献にもつながります。 そのため、研究データ管理を強力に推し進めている欧米では、大学等の研究機関が「研究データ管理サービス」を自機関の研究者に対し提供しているところが少なくありません。 しかしながら、日本の研究機関では、研究データ管理サービスを機関として組織的に提供している機関はほとんどありません。 第1章で触れた、政府のオープンサイエンス政策や研究不正対策、国内外の研究助成機関のポリシーの動向をも考えると、研究データ管理サービスを整えていくことがすでに喫緊の課題であることがおわかりいただけると思います。 本章では、自機関の状況に合わせて研究データ管理サービスをデザインし、研究者に提供していくためのステップを学びます。 Design of Research Data Services
7.1 研究データ管理サービスとは
7.1.1 研究データ管理サービスとは? 研究機関が研究者に対して提供できる研究データ管理サービスはさまざまなサービスから成り立っている。 研究プロジェクト 管理基盤(ハード) 人的支援(ソフト) データ管理計画 作成支援 プレアワード 実施 研究データ 研究者に 対する研修 再利用 生成 オンラインストレージ 窓口の設置 加工 分析 長期保存ストレージ データキュレーション 広報・ アドボカシー 保存 公開 データリポジトリ メタデータ作成支援 それでは「研究データ管理サービス」とはいったい何でしょうか? ここでは、研究者によって生み出される研究データを適切に管理できるように、研究を支援するスタッフが協働で、必要なサービスを提供することを「研究データ管理サービス」とします。 研究データ管理サービスには、研究データを保存するハードウェアなどの管理基盤の提供や、研究助成機関が提出を義務付けるデータ管理計画の作成支援も含まれます。 研究者がプロジェクトのための研究助成金を得るまでのプレアワード、そして研究プロジェクトの実施、さらに研究によって生み出された研究データの公開に至る流れに沿って、各種の研究データ管理サービスをマッピングしたのがこの図です。 さまざまなサービスが考えられますが、機関のレベルで研究データ管理サービスを検討する場合には、自分の機関の状況に合わせて、これらを組み合わせ、担当部門が連携して設計するのが理想的です。 別々の部門が連携せずに各々でサービスを提供すると、無駄や重複が発生し、研究者も混乱してしまいます。 研究機関が研究者に対して提供できる研究データ管理サービスはさまざまなサービスから成り立っている。 自機関の状況に合わせてこれらを組み合わせ、担当部門を横断してサービスを設計する必要がある。
7.1.2 研究データ管理サービスとは?:人的支援 研究者に対する研修 研究データに関する相談窓口の設置 広報、アドボカシー 講義やeラーニングで、研究者が研究データ管理に関する知識 を身につけられるようにする 研究データに関する相談窓口の設置 研究者が研究データ管理に関していつでも相談できる窓口を設 置する 相談内容の例:共同研究での研究データの保存方法、ポリシーに 沿ったデータ管理計画 広報、アドボカシー 研究データ管理の重要性、必要性を理解できるよう、研究者に 対して広報する データ管理計画 (DMP) 作成支援 助成プログラムの要求に合ったDMP作成 DMPツールやひな形の提供 研究データ管理サービスを構成するさまざまな方策を具体的に見ていきましょう。 まずは、研究者に対する研修です。 研究者が研究データ管理として何をすればよいのか短時間でわかるガイダンスや、eラーニングの提供が考えられます。 研究者といっても、研究室の管理者である教授から、これから研究代表者となってデータ管理計画を作成しなければならない若手研究者や大学院生まで、さまざまなレベルがあります。また、研究分野によって扱うデータの種類はさまざまです。分野によって公開・非公開の考え方も異なるでしょう。レベルや分野に合わせた研修の機会を提供することが最善です。 次に、研究データに関する相談をメールや電話で受けることができる窓口サービスも考えられます。データ管理計画の作成についてや、研究データの保存方法について、研究者が疑問に思ったことをすぐに解決できる窓口です。研究データに関しては、図書館や情報基盤部門など複数の組織がサービスを提供することになる場合が多いと考えられます。研究者が、研究データに関して、どこに質問してよいのか迷わないように機関内で窓口を明確にし、担当者が誰であるかがわかるようにするのが望ましいでしょう。 また、研究データ管理の必要性や重要性はまだあまり広く認知されていないことから、リーフレットやポスター、ウェブサイトなどで継続的に広報を行うことも重要でしょう。さまざまな研究者コミュニティにアプローチし、研究データ管理の必要性や重要性に関する理解を深め、誤解や疑問を解消するアドボカシー活動も時間をかけて行う必要があるでしょう。 研究助成機関から求められるデータ管理計画書(DMP)の作成についての相談に応じたり、ひな形を提供するといったサービスも今後はますますニーズが高まると考えられます。
7.1.3 研究データ管理サービスとは?:管理基盤 データの「生成」を支援する データの「保存」を支援する オンラインストレージの提供 必要な機能の例: ローカル環境との同期、ファイルのバージョ ン管理、チームでの共有、十分なセキュリティの確保 データの「保存」を支援する 長期保存のためのストレージの提供 保存するデータの選別(データキュレーション) データの「公開」「再利用」を支援する データリポジトリの提供 メタデータ作成支援 ORCID、DOIなど識別子の機関管理、付与 データライブラリアンなど専門的人材の配置 次に、ストレージなどの管理基盤の提供も研究データ管理サービスの一部となります。 研究データのライフサイクルでいうと、データの「生成」の部分を支援するのが、オンラインストレージの提供です。 オンライン、あるいはクラウドストレージのようなデータの保存領域を研究機関が提供することも多くなってきましたが、研究データ管理においてはバージョン管理や、チーム内で簡単にファイルが共有できるDropboxのような機能が求められます。 次にデータの「保存」を支援するサービスとして、長期保存を目的とした、データを頻繁に出し入れしないストレージの提供が考えられます。これは、研究公正の側面からも非常に重要です。しかしながら、すべてのデータを長期間保存し続けるということは現実的ではないため、一定の条件で選別して残すという「データキュレーション」が必要となってきます。 またデータの「公開」は、データリポジトリの提供による支援が考えられます。公開するデータに適切なメタデータを付けてリポジトリに登録すれば、他の研究者による研究データの「再利用」も促進できます。 データセットにDOIを付与したり、研究者のIDであるORCIDを登録したりしておくと、データの引用のモニタリングやカウントが容易になり、研究者のインセンティブにつながります。DOIやORCIDは機関単位で管理して付与することも可能ですので、他のサービスと合わせて検討するとよいでしょう。 欧米では、データキュレーションやメタデータの作成を行うために、専門的な知識をもったデータライブラリアンを配置しているところもあります。
university research data management 7.1.4 研究データ管理サービスとは?:事例 サービス設計の事例: エディンバラ大学 ここで、エディンバラ大学のサービスについて紹介します。これは2014年時点のものですが、エディンバラ大学では、研究サイクルにあわせてさまざまなサービスを研究者に提供しています。 まず、「研究前」のプレアワードの段階に対しては、Digital Curation Centre、略してDCCと呼ばれる国レベルの研究データに関する専門の情報提供機関から提供されている「DMPオンライン」という、データ管理計画を作成するためのオンラインツールを使い、研究者が助成機関のフォーマットに合わせた計画書が作成できるように支援しているとのことです。 「研究中」のプロジェクトに対しては、Own CloudというDropboxのようなシステムを用いて、研究者一人あたり500GBのオンラインストレージを提供しています。 終了した研究プロジェクトに対しては、研究データが研究者間で共有できるデータリポジトリ「DataShare」を運用するほか、「Data Vault」という研究データの長期保存のストレージも、試験的に提供しています。 ここで気をつけていただきたいのが、この例はあくまで一例であるということです。 エディンバラ大学はイギリスでも有数の研究大学であり、DCCの強力なパートナーでもあり、研究データ管理では世界で最も進んだ研究機関の一つです。 これを参考にして、自分の機関に合わせた独自のサービス設計を行うことが重要です。 エディンバラ大学だけでなく、各研究機関がさまざまな研究データ管理サービスを提供していますが、先行する欧米の大学では、充実したウェブサイトでその情報を発信しています。ウェブサイトは、university research data managementのようなキーワードで検索するとたくさん出てきますので、参考にしてください。 university research data management で検索
7.2 サービスの設計
7.2.1 サービスの設計 機関の状況によってサービス設計を進める主体、順序は異なるが、海外の研究機関の経験を参考にしながら全学レベル/部門横断的に取り組むことが、研究データ管理サービス設計の成功のカギ DCCの勧める研究データ管理サービス設計のためのアクション 1. 研究データ管理に取り組む組織体制づくり 研究担当理事や副学長のリーダーシップのもと、研究データ管理を主幹する委員会等を設定す る 実際に業務を実施する責任と技能を備えたメンバーで構成される研究データ管理チームを設置 する 2. サービス設計のための調査 自機関における研究データ管理の現状やニーズを把握する 3. サービスの試行、評価 政策や助成機関など外部からの要求にも合致し、自機関の現状や文化にも合うサービスを設計 する サービスを試行し、結果を検証し、実施する つぎに、研究データ管理サービスの設計についての実践的なステップについて説明します。研究機関によって、サービス設計を進める主体、順序はさまざまです。海外の研究機関の事例を参考にしながら、全学レベルかつ部門横断的に取り組むことが、研究データ管理サービス設計の成功のカギです。 DCCは、研究データ管理サービスの設計をすすめるにあたっては下記のようなアクションを推奨しています。 まずは、研究を所管する理事や副学長のリーダーシップのもとに研究データ管理を主幹する委員会等を設置したり、実際に業務を実施する責任と技能を備えたメンバーで研究データ管理チームを設置し、研究データ管理に取り組む全学的な体制を作ることです。体制づくりのプロセスは、トップダウンかボトムアップか、どちらの場合もありえますが、組織横断的な体制を組むことがのぞましいため、最終的には執行部レベルのサポートがあることが望まれます。 そして、自機関に見合ったサービス設計を行うために、研究データ管理に対して研究者や学部単位でどういったニーズがあるのかを調査します。 どのようなサービスが必要かが把握できたところで、実施主体を決定し、実際のサービスをまずは試行するところから始めます。そして試行結果を検証し、サービスの本実施につなげます。 これはたいへん時間のかかるプロセスとなります。 さきほど例に挙げたエディンバラ大学でも、2008年に研究データに関する調査を行い、データリポジトリなど徐々にサービスを運用開始し、包括的な研究データ管理プログラムが導入されたのは2012年です。現在も試行を重ね、システムの改善など長期的に取り組んでいます。
7.2.2 サービスの設計:組織体制 研究者以外のステークホルダーの特定 担当の副学長、理事 ITスタッフ 図書館職員 研究データ管理に取り組む組織体制づくり 研究者以外のステークホルダーの特定 担当の副学長、理事 ITスタッフ 図書館職員 URA/リサーチ・アドミニストレーター 研究コンプライアンス担当 研究室秘書 事務職員 研究データ管理サービスを実際に運用する主体は、機関の中のさまざまな既存の組織に所属する研究支援スタッフです。 研究者以外のステークホルダーをもれなく想定し、それぞれが既存の役割に応じて全学レベルの研究データ管理において何ができるか、責任をもって取り組めるような体制を整備しなければなりません。組織横断的な体制づくりも長期的な取り組みとなることが予想されます。 最初からすべてのステークホルダーに参加を呼びかけるのではなく、研究データ管理に関心のある研究者コミュニティに参加してもらうなど、さまざまな進め方があるでしょう。 ステークホルダーをもれなく想定し、それぞれの役割に応じて全学レベルの研究データ管理に取り組んでもらう組織をつくる。
7.2.3 サービスの設計:事例 組織体制の事例:エディンバラ大学 これはエディンバラ大学の研究データ管理体制です。 これはエディンバラ大学の研究データ管理体制です。 研究データ管理を担当する「情報サービス」にさまざまな部門が関わっていることがわかります。例えば図書館スタッフは、「図書館と大学のコレクション」、「ユーザーサービス部門」の一部、及び「EDINAとデータライブラリー」の一部を担っているとのことで、それぞれの担当部門も組織横断的な構成となっていることがうかがえます。
7.2.4 サービスの設計:調査 (1) サービス設計の前にまずは調査を実施し、自機関の研究者の研究データ管理の実態やニーズを把握する 目的 研究者が取り扱っているデータの実状を定量的に把握し、管理基盤整備の参考とする。 研究者の研究データ管理に対する予備知識や意識を把握し、必要な研修や、アドボカシー活動の 計画に活かす。 推奨される方法 アンケート調査 インタビュー調査 参考 DAF (Data Asset Framework) =研究データを資産と捉えた一連の調査の枠組み。イギリスの大学 で実施例がある。 http://www.data-audit.eu/ http://www.data-audit.eu/docs/DAF_Implementation_Guide.pdf (具体的な質問項目が紹介されてい る) RDM Rose 2015 > 3.1 DAF surveys / 2.6 Interviewing a researcher http://rdmrose.group.shef.ac.uk/?page_id=1061 サービスの設計にあたっては、まずは必要なサービスを特定するために、調査を実施して、研究者の研究データ管理の実態やニーズを把握するとよいでしょう。調査の方法には、アンケート調査やインタビュー調査があります。 インタビュー調査は、さまざまな分野の研究者の生の声を聞くと同時に、研究データ管理への関心を高めるよい機会ともなりますので、調査の対象人数は少なくても実施することが望ましいと考えられます。 調査の具体的な方法については、Data Asset Frameworkと呼ばれる、研究データを資産と捉えて実施された調査結果がいくつかありますので、その枠組みを利用するとよいでしょう。
7.2.4 サービスの設計:調査 (2) アンケート調査 研究データの種類は何ですか? 設問の一例 研究データの種類は何ですか? 文書、スプレッドシート、生データ、データベース、ノート、etc. 現在の研究プロジェクトで生み出されるデータの容量はどれくらい ですか? 1GB以下、1~50GB、・・・100TB以上、不明 研究データの共有について下記にどれくらい同意しますか? 「他の研究者がデータを共有していたら使いたい」 「私の研究データはすべてリポジトリに登録する」 研究データ管理に関する研修に興味はありますか? 著作権と知的財産 データ管理計画の作成方法 これが、アンケート調査の設問の一例です。 研究者に対し、研究プロジェクトで生み出されるデータの種類や容量、保存方法、研究データ共有に関する意識や、サービスへの関心を尋ねます。 なお、研究者には、時間を費やしてアンケートに回答してもらうことになりますので、研究機関としてアンケートへの協力を求める際には充分な説明と動機付けが必要です。
7.2.4 サービスの設計:調査 (3) インタビュー調査 あなたの研究分野について教えてください。 設問の一例 あなたの研究分野について教えてください。 あなたが保有している研究データについて、もう少し詳しく教えて ください。 ID、著者、保有者、タイトル、形式、サイズ、etc. 研究助成金の申請の際、あるいは採択後にデータ管理計画を作成し たことはありますか? 共同研究のときにデータの扱いについて問題はないですか? データはどのようにバックアップをとっていますか?その際、何か 問題はありませんか? あなたの研究データ管理について、大学からどのような支援がある とよいですか? これはインタビュー調査の設問の一例です。 質問する項目のうち、基本的な項目はこの例のように決めてからインタビューに臨みます。 アンケート調査と同じような項目もありますが、選択回答などでは答えにくい、長期的な管理への不安や、機関への期待、研究データ管理への関心や意識を柔軟に尋ねるとよいでしょう。
7.2.5 サービスの設計:試行、評価 組織体制づくり 試行 調査 設計 サービス設計 PDCAサイクル 評価 本実施 改善 スモールスタートで 組織体制づくり 試行 資金調達 調査 自機関の現状、 ニーズに 合っているか? 設計 サービス設計 PDCAサイクル 評価 本実施 改善 研究データ管理サービスの定着は長期的計画で オンラインストレージなど管理基盤の提供(ハード)、相談窓口やトレーニングなどの人的支援(ソフト)ともに、試行と評価、改善をくりかえしながら、自分の機関に合ったサービスを構築し、組織内の意識を高めていくことが重要 ニーズや現状が把握できたら、7.1で述べた研究データ管理サービスを自機関の状況に合わせて設計し、できるところから試行しましょう。平行して、研究者に対する広報やアドボカシー活動を通じて関心・理解度を高め、サービス内容の評価、改善を繰り返します。 新たな資金が必要になる場合は、機関の内外から資金を獲得することも必要になるでしょう。 ハードウェアに関しては、機関のシステムのリプレイスなどタイミングを見計らうことも必要となります。 サービスの定着には時間がかかりますので、組織内で理解が得られ、予算や人材の確保など準備が整ったところから順に実施するのがよいでしょう。