研究データのライフサイクルと 本コンテンツとの関わり 生成 加工 分析 保存 公開 再利用 章 導入 1 3

Slides:



Advertisements
Similar presentations
All Rights Reserved, Copyright © 2001 GeoBasic® & IIMS® Networking GIS データ共有型 GIS 2001年2月 ジーイーネット 株式会社.
Advertisements

3. 写真・ CAD 図面について. 2 成果品のファイル形式 委託業務 ファイル形式 管理ファイル業務管理ファイル XML 各フォルダ管理ファイル XML 成果品文書ファイル等オリジナル形式 doc ・ jtd ・ xls 等 pdf 形式 pdf 図面ファイルオリジナル形式 dxf ・ dwg.
eL-Stat(地方自治体の統計業務支援窓口)の構築
《Ⅴ 解説》 35.監査調書様式体系の全体像 【監査の基本的な方針】 【詳細な監査計画】 【リスク評価手続】 【リスク対応手続の立案】
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) ペデスタル外調査装置の装置改善仕様及び改善効果の整理
資料1-4 平成27年度 第1回技術委員会 2015年度技術委員会の目標と 検討項目(案)
DRMのコンセプト 2004/01/15 DRM 入江 伸.
電子行政オープンデータ推進のためのロードマップ(工程表)
グループ研究1班 第一章 経営戦略とは何か 雨森 彩 大嶋 健夫 小沢 博之.
NIIメタデータデータベースの構想 国立情報学研究所 開発・事業部 コンテンツ課 米 澤 誠
第1章 図書館の意義、果たす役割 1.図書館とはなにか (1)さまざまな図書館 a.ブックスタートから児童サービスへ ・子供のための文庫
情報概論 発表者:小野正広 3/18/2017.
空間メタデータ整備 における課題 園山 実 三菱総合研究所.
標準空間情報の整備及び 異種データベース間のデータ交換手法 に関する研究開発
学術機関リポジトリとは 定義 学術機関リポジトリ (Institutional Repository) は,大学あるいは研究機関の電子的な知的生産物(論文,電子的教材,実験データ,学会発表資料)を蓄積し,保存し,(原則として)無料で発信するための保存書庫。 意義 研究成果の視認性とアクセシビリティの向上.
2008年3月一般公開開始 主な取り組み ・システムセットアップ及びカスタマイズ(H19.3-) 平成19年度委託事業概要
「教育工学をはじめよう」  第2章     学会発表に向けて     プロポーザルを書く 発表 菊池 陵  皂 智樹.
Preservation and Data Sharing
RDM support before research projects
東京大学空間情報科学研究センターを 中心とした空間情報データベースの整備
【1 事業の目的、内容及び実施方法】 1.1 事業目的
RDM Service: design and practice
「沖縄におけるスポーツサイエンスの拠点化に向けた
6. ポリシー Policies.
トレーニングの際はスライド, ノートの両方を確認してください
Data Management Plan (DMP)
ソフトウェアを取り巻く環境の変化がメトリクスに及ぼす影響について
室蘭市GIS情報の(一部)オープンデータ化事業
平成28年 「IoT推進のための新産業モデル創出基盤整備事業 (ビッグデータを活用した新指標開発事業)」
長期滞在型テレワークの誘致及び導入検討調査
平成29年度 WPI新規拠点公募のポイント (採択数・支援規模・ホスト機関の要件 等) (研究領域) (ミッション) (その他) 1
研究ライフサイクルに沿った アカデミックデータマネジメント支援環境 による研究基盤強化及びイノベーション創出 -第1段:全国展開可能な「京都大学モデル」のプロトタイプ整備- 学術情報メディアセンター 梶田将司.
IoT活用による糖尿病重症化予防法の開発を目指した研究
「沖縄におけるスポーツサイエンスの拠点化に向けた
扉を開こう!」 “Open in order to ・・・” 「すべての人・場面へ・・・ オープンアクセスウィーク? どうやってOAにする?
1.保有データを自治体Webサイトで公開しよう①
“Open in order to ・・・” 「誰に扉を開くのか」 オープンアクセスウィーク? どうやってOAにする?
これを享受できるようにする、オープンアクセス運動。
KARN 鹿児島県 学術共同 リポジトリ 始めます 意 義 あなたも
すべて読む Microsoft SharePoint ニュース
情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(CODH)
「政府標準利用規約(第2.0版)」の概要 「政府標準利用規約(第2.0版)」の概要は以下のとおり。 1.基本的なコンテンツの利用ルール
「地域経済産業活性化対策調査(沖縄市が整備するアリーナ施設を核としたまちづくり等に関する基礎調査)」
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) 1.1.1アクセス装置の概念検討
平成25年度オープンデータ実証実験 自治体行政情報実証(概要)
【1.1 事業(調査)目的】 1 8.1 (別紙1) 提案書雛型 本事業(調査)の目的について 記述内容
第一回 情報セキュリティ 05A1027 後藤航太.
エコアクション21で企業価値を高めることができます
資料2-2 平成26年度 第2回技術委員会資料 次年度検討テーマ案
事業区分: 課題調査事業 コンソーシアム等名称: ○○ 事業名: △△ 代表団体名: □□ 参加団体: ▲▲、■■ 協力団体: ●●、◎◎
広島県商工労働局イノベーション推進チーム
地方公共団体オープンデータ推進ガイドラインの概要
資料10-1 エコアクション21  事業概要.
単独事業者での応募にあたっては、コンソーシアム等名称、参加団体の記入は必要ありません。 事業区分: 課題調査事業 コンソーシアム等名称:
構造的類似性を持つ半構造化文書における頻度分析
設計情報の再利用を目的とした UML図の自動推薦ツール
6月制定の横浜市市民協働条例をめぐるラウンドテーブル
(平成25年6月25日 各府省情報化統括責任者(CIO)連絡会議決定)
新入社員トレーニング 発表者名 発表日 このテンプレートは、トレーニング資料をグループ設定で紹介するための開始ファイルとして使用できます。
資料3-2 平成26年度 第3回技術委員会資料 次年度テーマの検討
Microsoft® Office® 2010 トレーニング
(別紙1) 提案書雛型 令和元年度 沖縄型テレワーク実装推進調査 ー提案書ー                        (日付)                        (企業名)                        (連絡先等)
第2回実務者会議の議論を受けた検討(データWG関係)
図表:NZGOALの審査および公開プロセスに関するフローチャート
1.保有データを自治体Webサイトで公開しよう①
第2回実務者会議の議論を受けた検討 資料14 1 第2回実務者会議での議論の概要 (○:有識者意見、●:関係府省意見) 1
現在対応 将来展望 変動的 操作スキル プログラミング 情報モラル 探究スキル 普遍的 図13−1 情報活用能力の構成要素 (p.176)
Ⅲ 地球地図アプリケーション戦略の施策案(2)
○ 大阪府におけるHACCP普及について S 大阪版 評価制度を設ける 大阪府の現状 大阪府の今後の方向性 《従来型基準》
オープンアクセスウィーク? どうやってOAにする? 自分ができることは何? 日本の大学・研究機関では? それでオープンアクセスって?
Presentation transcript:

研究データのライフサイクルと 本コンテンツとの関わり 生成 加工 分析 保存 公開 再利用 7 6 1 2 3 4 5 1章 導入 1 3 1章 導入 生成 加工 分析 保存 公開 再利用 1 3 2 4 5 6 7 2章 データ管理計画 2 5 2 4 3章 保存と共有 5 4章 組織化、文書化、    メタデータ作成 研究データのライフサイクル 2 2 5章 法・倫理的問題 4 5 2  研究データにはどのように生成され、保存され最終的に再利用されていくのかといったライフサイクルがあります。本『研究データ管理トレーニングツール』の各章では、研究データをどのように管理していくかについて解説していきます。この図は『研究データ管理トレーニングツール』の各章がその研究データのライフサイクルに対して、どのように関わってくるかを表した図です。  例えば、第三章「保存と共有」は研究データの保存、公開、再利用の部分に関わってくることがわかるようになっています。学習中、研究データ管理のどの部分を学んでいるのかをこの図を見ながら常に意識してください。 6章 ポリシー 5 ・The UK Data Archive ( http://www.data-archive.ac.uk/create-manage/life-cycle ) ・RDM Support - basic training course for information specialists (http://dx.doi.org/10.6084/m9.figshare.1285313) より 7章 研究データ管理サービス    の設計

1. 導入 Introduction それでは、第一章「導入」に入っていきます。  それでは、第一章「導入」に入っていきます。  この章では、これから研究データ管理について学んでいく上で、なぜ研究データ管理の必要があるのか、その背景について学びます。また、これから学習を進める上で基礎となる研究データの定義についても触れていきます。 Introduction

1.1 背景  まずは、研究データ管理が求められる背景についてみていきましょう。

1.1.1 オープンサイエンスの潮流(1)  オープンサイエンスとは、オープンアクセスと研究データのオープ ン化(オープンデータ)を含む概念である。オープンアクセスが進む ことにより、学界、産業界、市民等あらゆるユーザーが研究成果を広 く利用可能となり、その結果、研究者の所属機関、専門分野、国境を 越えた新たな協働による知の創出を加速し、新たな価値を生み出して いくことが可能となる。また、オープンデータが進むことで、社会に 対する研究プロセスの透明化や研究成果の幅広い活用が図られ、また、 こうした協働に市民の参画や国際交流を促す効果も見込まれる。さら に、研究の基礎データを市民が提供する、観察者として研究プロジェ クトに参画するなどの新たな研究方策としても関心が高まりつつあり、 市民参画型のサイエンス(シチズンサイエンス)が拡大する兆しにあ る。近年、こうしたオープンサイエンスの概念が世界的に急速な広が りを見せており、オープンイノベーションの重要な基盤としても注目 されている。  これは、平成28年1月に内閣府の策定した第5期科学技術基本計画の一部です。  その中で、オープンサイエンスとは、論文やそのエビデンスとしての研究データなどの研究成果を広く一般社会へ公開し、イノベーションの創出へとつなげることとされています。  そのメリットとして、分野を超えた新たな知見の創出や、研究成果の幅広い活用が図られることなどが挙げられます。 http://www8.cao.go.jp/cstp/kihonkeikaku/5honbun.pdf 第5期科学技術基本計画 本文 より

1.1.1 オープンサイエンスの潮流(2)  こうした潮流を踏まえ、国は、資金配分機関、大学等の研究機関、 研究者等の関係者と連携し、オープンサイエンスの推進体制を構築す る。公的資金による研究成果については、その利活用を可能な限り拡 大することを、我が国のオープンサイエンス推進の基本姿勢とする。 その他の研究成果としての研究二次データについても、分野により研 究データの保存と共有方法が異なることを念頭に置いた上で可能な範 囲で公開する。  第5期科学技術基本計画では、「国は、資金配分機関、大学等の研究機関、研究者等の関係者と連携し、オープンサイエンスの推進体制を構築する。」とあり、論文のみならず研究データもオープンにしていくことが、我が国の基本姿勢となることが明記されています。 http://www8.cao.go.jp/cstp/kihonkeikaku/5honbun.pdf 第5期科学技術基本計画 本文 より

1.1.2 不正対策 『研究活動における不正行為への対応等に関するガイドライン』 (文部科学省)*1 p8「このことから、研究機関において、研究者に対して一定期間研究 データを保存し、必要な場合に開示することを義務付ける旨の規程を設 け、その適切かつ実効的な運用を行うことが必要である。」 『科学研究における健全性の向上について』(日本学術会議)*2 p8「資料(文書、数値データ、画像など)の保存期間は、原則として、 当該論文等の発表後10年間とする。電子化データについては、メタデー タの整理・管理と適切なバックアップの作成により再利用可能な形で保 存する。」  一方で、研究データ管理が注目される背景には、研究不正を防止する役割への期待もあります。  研究データに関しては文部科学省の提示した『研究活動における不正行為への対応等に関するガイドライン』でも「研究者に対して一定期間研究データを保存し、必要な場合に開示することを義務付ける」と明記されています。  また、文部科学省の依頼を受けて審議が行われた日本学術会議の『科学研究における健全性の向上について』においては、保存期間は原則として論文発表後10年間という具体的な数字にまで言及されています。 *1 http://www.mext.go.jp/b_menu/houdou/26/08/__icsFiles/afieldfile/2014/08/26/1351568_02_1.pdf より *2 http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-23-k150306.pdf より

1.1.3 助成機関のポリシー 研究資金の助成機関によっては、研究資金提供の条件として、研究データ管理を文書化したデータ管理計画 (Data Management Plan / DMP) の提出を義務付けているところもある。 e.g.) イギリスの助成機関における資金提供ポリシー一覧 ポリシーの範囲 ポリシーの条項 支援体制 助成機関 論文等 データ 時限 DMPの提出 共有 長期的整備・保存 監視 ガイダンス リポジトリ データセンター 諸費用の負担 AHRC ● BBSRC CRUK EPSRC ESRC MRC NERC STFC Welllcome Trust  研究資金の助成機関のなかには、データ管理計画、英語ではData Management Plan、略してDMP、と呼ばれる研究データ管理に関する計画書の提出を資金提供の条件にしているところもあります。スライド資料の表は、その例としてイギリスの助成機関の資金提供ポリシーをまとめたものです。このように、多くの助成機関がDMPの提出を求めていることがわかります。  DMPに関しては、第二章で詳しく取り上げます。 ●はポリシーでカバーしている、●は部分的にカバーしている、●はカバーしていないことを示す。 http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies より(2017/03/12現在)

1.2 研究データとは  研究データ管理が求められている背景がわかったところで、ではそもそも研究データとはなにかについてみていきましょう。

1.2.1 研究データとは 研究データとは研究の過程で、あるいは研究の結果として 収集・生成される情報である。仮説を検証するために使用 されたり、結論を導くための根拠となる。また、後に研究 結果が正しいかどうか確認するために使用されることもあ る。 電子的なデータのみ研究データと定義することも、紙ベー スの情報も研究データに含める場合もある。 研究データのとる形式はテキストや3Dモデルなど様々であ り、記録されるものも研究ノートや写真、音声テープなど 多岐にわたる。  研究データとは、研究の過程、あるいは研究の結果として収集・生成される情報です。仮説を検証するために使用されたり、結論を導くための根拠となります。また、後に研究結果が正しいかどうか確認するために使用されることもあります。  電子的なデータのみ研究データと定義することも、紙ベースの情報も研究データに含める場合もあります。  また、研究データのとる形式はテキストや3Dモデルなど様々であり、記録されるものも研究ノートや写真、音声テープなど多岐にわたります。  研究データの定義は、研究機関や助成機関によって異なる場合があります。必要に応じて、それぞれの定義を確認して下さい。

1.2.2 研究データを構成するもの 文書ファイル、スプレッドシート 研究ノート、フィールドノート(野外調査の記録)、日誌 アンケート、転写物、コードブック 音声テープ、ビデオテープ 写真、フィルム 試験・検査への反応、応答 スライド、人工物、標本、サンプル 研究の過程で獲得され、生成されたデジタル資料のコレクション 統計的なデータファイル データベースのコンテンツ(ビデオ、音声、テキスト、画像) モデル、アルゴリズム、スクリプト アプリケーションソフト 方法論、ワークフロー 標準的な操作手順  研究データは、ノートに記録されたものからデータベースに格納されたものなど、様々なもので構成されています。ここにあげたのは、その一例です。各研究データを電子的に保存するためのファイルフォーマットには、テキスト、数値、画像、音声形式などがあります。ファイルフォーマットの詳細については、第三章で詳しく取り上げます。

1.2.3 研究データの具体例 観測データ (Observational) 実験データ (Experimental) 自然現象等を観測し取得されたデータ。 例:天体観測、気象観測、社会調査 実験データ (Experimental) 実験によって得られたデータ。高価になることもある。 例:DNAシークエンス、クロマトグラム、微量検定法により得られたデータ シミュレーション (Simulation) モデルやコードを用いて生成されたデータ。得られたデータに加え、使用された モデルやコード、パラメータセットも重要。 例:気象モデル、経済モデル 派生データ・編集されたデータ (derived/compiled) 取得したデータを加工、あるいは結合することによって得られたデータ。 例:データマイニング、テキストマイニング、3Dデータ 参照/標準データ (Reference or canonical) 研究の過程で参照されるデータ、データセット。あるいは標準的なデータのコレ クション。整理・共有されているものも多い。 例:遺伝子配列データバンク、結晶データベース、歴史画像アーカイブ  研究データは、目的に応じて様々な手段で取得されます。ここでは、研究データの具体例をいくつか挙げてみました。  まず、自然現象等の観測により取得されたデータです。例えば、天文観測や気象観測などがあげられます。  次は、実験によって得られたデータです。DNAシーケンスやクロマトグラムなどがあげられます。  モデルやコードを用いてシミュレーションをした結果得られたデータもあります。得られたデータに加え、シミュレーションに使用されたモデルやコード、パラメータセットも管理すべきデータとして重要です。このタイプの研究データの例として、気象モデルや経済モデルなどに基づくデータなどがあげられます。  取得した生データを編集・加工したデータもあります。データマイニングなどにより処理されたデータなどがあげられます。  また、研究の過程で参照するデータセットもあります。例えば、遺伝子配列データバンクや歴史画像アーカイブなどがあげられます。

1.2.4 研究データのライフサイクル 生成 加工 分析 保存 公開 再利用  次に、本章の冒頭にもあげた、研究データが作られてから再利用されるまでのライフサイクルの図をもう一度見てみましょう。  まず、データの「生成」の段階、ここでは研究そのものの計画とともに、データ管理計画の策定やデータの共有方針が定められます。そして既存のデータの検索が行われたり、新たにデータが収集されていきます。  次にデータの加工の段階では、収集されたデータの、デジタル化、形態変換、確認、検証、クリーニングなどが行われます。その他、データの個人情報の匿名化作業も必要となる場合があります。  データの分析の段階では、収集・加工したデータから必要なデータを抽出したり、データから情報を読み取ることなどをします。ここで、論文など、研究のアウトプットの作成や、データの保存に向けた準備をしていきます。  データの保存の段階では、データを適切なフォーマットやサイズに変更し、バックアップを作成し、メタデータや証拠文書の作成も行います。  データの公開の段階では、データの配布、共有、アクセス制御、著作権処理等をしています。  そして、公開されたデータは、追跡研究や新たな研究で再利用されます。データは、研究の評価・精査に利用されたり、あるいは教育・学習にも役立てられたり、イノベーション創出の過程で使われることがあります。   ・The UK Data Archive (http://www.data-archive.ac.uk/create-manage/life-cycle) ・RDM Support - basic training course for information specialists (http://dx.doi.org/10.6084/m9.figshare.1285313)より

1.2.5 研究と研究データ 研究データはしばしば、その研究データが得られた 研究プロジェクトよりも寿命が長い。研究者は資金 援助が終わった後もデータに関する作業を続け、後 に続く研究ではそのデータが分析されたり、新たに 追加され、さらには他の研究者によって再利用され ることもありうる。 組織化、文書化、保存・共有がしっかりとされた データは科学研究を推進することや、学習及びイノ ベーションの機会を増やすことにおいて計り知れな い価値がある。  以上のことからわかるように、一般に、研究データはそれが得られた研究のプロジェクトよりも長く使われます。研究データを得た研究者、あるいは他の研究者によって再利用されるためです。  したがって、組織化、文書化、保存・共有がしっかりとされたデータは科学研究を推進することや、学習及びイノベーションの機会を増やすことにおいて計り知れない価値があります。 https://www.ukdataservice.ac.uk/manage-data/lifecycle  より

1.3 研究データ管理とは 本ツールでは、電子的なデータのみを対象として、 その扱い方について学んでいきます。  研究データがどのようなものかをつかめたところで、次に、研究データ管理についてみていきます。なお、本『研究データ管理トレーニングツール』では、電子的なデータのみを対象として、その扱い方について学んでいきます。 本ツールでは、電子的なデータのみを対象として、 その扱い方について学んでいきます。

1.3.1 研究データ管理 (Research data management) とは RDMS | Introduction to research data 14 January 2014 1.3.1 研究データ管理 (Research data management) とは 「研究データ管理」とは、一般的にある研究プロジェクト において使用された、あるいは生成された情報を、どのよ うに組織化、構造化、保管、管理していくのかを指す言 葉。 研究データ管理には次のようなことが含まれる: どのようにデータを取り扱っていくかの計画(Data Management Plan)策定 研究プロジェクトが行われている間の、日々の情報の取り扱い 方 長期的にデータをどのように取り扱うか(研究プロジェクトが 終わった後はそのデータをどうするのか) >第2章も参照  研究データ管理は英語ではResearch Data Management、略してRDMと言います。  「研究データ管理」とは、一般的に、ある研究プロジェクトにおいて使用された、あるいは生成された情報を、どのように組織化、構造化、保管、管理していくのか、を指す言葉です。   研究データ管理には、たとえば次のようなことが含まれます。 ・どのようにデータを取り扱っていくかの計画策定 ・研究プロジェクトが行われている間の日々の情報の取り扱い方 ・長期的にデータをどのように取り扱うか このうち、データの取り扱いに関する計画を一般的にデータ管理計画(DMP)といいます。先ほど助成機関のポリシーを紹介しましたが、このDMPの提出を研究資金の提供条件としている海外の助成機関もあり、日本でも今後ますます重要となっていきます。DMPについては詳しくは第二章で学びます。 http://researchdata.ox.ac.uk/home/introduction-to-rdm/ より

RDMS | Introduction to research data 14 January 2014 1.3.2 研究データ管理のメリット 研究効率 研究効率の上昇 長期的に時間や資源を節約 データセキュリティの強化とデータ消失リスクの最小化 データを他の研究者が再利用することにより、労力の重複を避ける ある時点のデータを他の時点と比較できるデータを提供することにより、データ の変化の分析を容易にする ポリシー 資金提供元の要求を満たす 産業界や商業界の慣行に従う 研究倫理 研究の再現性の確立 研究データや研究記録の正確性、完全性、真正性、信頼性の保障  研究データを適切に管理することによって様々なメリットがあります。  たとえば、時間の節約やデータ消失リスクを抑える、労力の重複を避けることなどの研究効率に関わるメリットや、助成機関等の資金提供元の要求を満たすといったポリシーに関わるメリットがあります。また、研究の再現性を確立させることや、研究データの信頼性を担保するなど、研究の倫理に関わるメリットもあります。

1.3.3 研究データ管理と大学図書館 すでに海外の大学ではデータ管理計画作成等の研究 データ管理業務に関する支援サービスを図書館や他 の関連組織が共同で行っているところもある 例1:バージニア大学 http://data.library.virginia.edu/data-management/ 例2:エディンバラ大学 http://www.ed.ac.uk/files/atoms/files/rds_booklet_may2 016.pdf 例3:ケンブリッジ大学 http://www.data.cam.ac.uk/support  例4:アムステルダム大学 http://rdm.uva.nl/en >第7章も参照  すでに海外の大学では、データ管理計画作成等の研究データ管理業務に関する支援を図書館や他の関連組織が共同で行っているところもあります。これらの大学はその例です。第7章では、これらの大学が提供している研究データ管理サービスについて詳しく解説します。