第1回データWGの開催概要 1 開催日 平成24年12月26日(水)

Slides:



Advertisements
Similar presentations
オープンデータ流通推進コンソーシアム 事務局 オープンデータ流通推進コンソーシアム オープンデータ化の評価指標案 平成 25 年度技術委員会 第2回 技術委員会資料 資料 2-7 抜粋 参考資料 4.
Advertisements

1 ( 様式8 ) 提案書雛型ア 資料2 - 1 (提案者名を記載) ○○○○ 受付番号 ア.地域見守りサービス創出における調査 平成 23 年度医療・介護等関連分野における規制改革・産業創出実証事業 ( IT 等を活用した医療・介護周辺サービス産業創出調査事業) 提案書 (提案事業のタイトルを記載:
平成 24 年度空間位置情報に関連する公共データの活用実証事業 自治体情報の利用に関する 調査結果のご報告 平成 24 年 3 月 11 日 JIPDEC (一般財団法人日本情報経済社会推進協会) 電子情報利活用推進部 次長 坂下哲也 IT.
オープン&ビッグデータ活用・地方創生推進機構 事務局 オープン&ビッグデータ活用・地方創生推進機構 民間保有データの有効活用に関する意見の とりまとめ 平成26年度 第2回データガバナンス委員会資料 資料4.
Web-GIS の開発と地盤情報の 高度利用に関する共同研究について -具体的な共同研究テーマ ( 案 ) - 「地質・地盤情報協議会」・ 「 Web-GIS コンソーシアム」説明会資料 全国地質調査業会連合会・情報化委員会.
オープン&ビッグデータ活用・地方創生推進機構 事務局 オープン&ビッグデータ活用・地方創生推進機構 評価版ツールの状況報告 平成26年度第3回 技術委員会 資料3-1.
スマートフォン、タブレット端末、ソーシャル・ネットワーキング・サービス(SNS)の普及等を背景に、多種多様な情 報を相互に連携させて新たな価値を生み出すことが期待されている。 地方公共団体オープンデータ推進ガイドラインの概要 0.ガイドラインの位置付け 国が掲げるオープンデータ取組の意義 1.経済の活性化、新事業の創出.
資料3-7 NIEM等 海外調査報告 経済産業省 CIO補佐官 平本健二.
(平成26年1月24日 第5回電子行政オープンデータ実務者会議 総務省提出資料)
1 これまでのオープンデータの取組状況 平成24年 「電子行政オープンデータ戦略」 7月 「世界最先端IT国家創造宣言」 平成25年 6月
オープンデータ流通推進コンソーシアム 情報流通連携基盤外部仕様書の 改訂案
1.利活用・普及委員会 平成25年度の活動内容(案)
地方公共団体オープンデータ推進ガイドライン および手引書の見直し(案)
データカタログサイト『DATA.GO.JP』(試行版)における掲載データの概要
電子行政オープンデータ推進のためのロードマップ(工程表)
地質地盤情報協議会案 仮称・地質地盤情報協議会の提案
平成24年度オープンデータ実証実験 災害関連情報(概要)
Linked e-Stat インディゴ株式会社 STAT DASH グランプリ 2016 行政サービス開拓部門 2016/3/5
共同調査研究事業 地方公共団体におけるコンピュータ利用及び住民サービスの向上に資する研究を、複数の地方公共団体が主体となって行う事業
地方公共団体オープンデータ推進ガイドラインの概要
2016年3月10日(木) 内閣官房 情報通信技術(IT)総合戦略室
データカタログサイト『DATA.GO.JP』(試行版)における掲載データの概要
空間メタデータ整備 における課題 園山 実 三菱総合研究所.
公共データの2次利用と経済活性化 <経済活性化>
オープンデータ流通推進コンソーシアム オープンデータ化の評価指標案
1.保有データを自治体Webサイトで公開しよう①
【事業名】 【事業代表者】㈱○○ ○○ 【実施予定年度】平成30~○年度 平成30年 月 日 (1)事業概要
「経理・財務サービス スキルスタンダード」の作成について - ダイジェスト版 -
昨年度VLEDの取組み 対象データ ・道路通行規制情報 ・食品営業許可情報 ・地盤情報(ボーリングデータ・土質試験結果など)
6. ポリシー Policies.
資料1-6 平成26年度 第1回技術委員会資料 支援ツール群整備方針
室蘭市GIS情報の(一部)オープンデータ化事業
平成29年度 WPI新規拠点公募のポイント (採択数・支援規模・ホスト機関の要件 等) (研究領域) (ミッション) (その他) 1
平成19年度青年部会「第2回~第4回研修会」(人材育成研修会)実施計画書
Open DATA METIの最近の取組と オープンデータに関する提言
クリアリングハウスの実現と展望 -検索から共用へ-
Mappin’ Drop 防災 減災 少子 高齢 産業 創出 Mappin’ Drop 誕生の キッカケ
1.保有データを自治体Webサイトで公開しよう①
外部仕様書・オープンデータガイド精査方針
資料1-5 平成26年度 第1回データガバナンス委員会資料 平成26年度検討事項(案)
資料6 平成24年度活動報告と平成25年度活動計画案 オープンデータ流通推進コンソーシアム事務局.
全国6,000以上の図書館からリアルタイムの貸出状況を確認できる
「政府標準利用規約(第2.0版)」の概要 「政府標準利用規約(第2.0版)」の概要は以下のとおり。 1.基本的なコンテンツの利用ルール
えっ、そこまでわかるの!?企業のつながり! オープンデータ活用基盤:LOD4ALL
(提案事業のタイトルを記載:80文字以内) ○○○○○○○○○○○○ (提案者名を記載) ○○○○
平成25年度オープンデータ実証実験 自治体行政情報実証(概要)
資料2-2 平成26年度 第2回技術委員会資料 次年度検討テーマ案
自治体サブワーキンググループ における検討事項
地方公共団体オープンデータ推進ガイドラインの概要(案)
平成29年10月30日 内閣官房情報通信技術(IT)総合戦略室
平成25年度オープンデータ実証実験 社会資本実証(概要)
地方公共団体オープンデータ推進ガイドラインの概要
「政府標準利用規約(第1.0版)」の概要 「政府標準利用規約(第1.0版)」の概要は以下のとおり。 1.基本的なコンテンツの利用ルール
データカタログサイト「DATA.GO.JP」の本格運用開始について
公共データWGにおける 利用条件等に関する検討状況等について
DATA METI構想を進めていくためのロードマップ(工程表)(案)
地方創生に向けた自治体SDGs推進事業 平成30年度予算案5億円(平成30年度からの新規事業) 実施期間:平成30年度~(新規)
電子行政オープンデータ推進のためのロードマップの概要
資料2 立地推進体制について(案) 平成23年7月26日.
(平成25年6月25日 各府省情報化統括責任者(CIO)連絡会議決定)
オープンデータに関する 経済産業省の取組と提言
平成25年度オープンデータ実証実験 統計情報・データカタログ実証(概要)
資料3-2 平成26年度 第3回技術委員会資料 次年度テーマの検討
オープンデータリーダ育成研修 資料集 講義ノート:
第2回実務者会議の議論を受けた検討(データWG関係)
1.保有データを自治体Webサイトで公開しよう①
第2回実務者会議の議論を受けた検討 資料14 1 第2回実務者会議での議論の概要 (○:有識者意見、●:関係府省意見) 1
資料2 2 政府標準利用規約(1.0版)の見直し.
オープンデータ流通推進コンソーシアム 情報流通連携基盤・外部仕様書 (平成24年度版) Call for Comment結果報告
行政保有データ(行政手続等関連)の棚卸結果概要 (平成31年3月とりまとめ)
Presentation transcript:

第2回実務者会議資料 資料1 第1回データ・ワーキンググループの 概要 2013年1月15日 事務局

第1回データWGの開催概要 1 開催日 平成24年12月26日(水) 1 開催日  平成24年12月26日(水) 2 参加者  データWG構成員 (※当日は、国土地理院及び気象庁は代理出席) 3 主な議事  ○ 機械判読可能なデータ形式による公開への期待     坂下構成員から発表 (ポイントはP3~5)  ○ データ形式・構造、データカタログに関する技術     小池WG主査代理から発表 (ポイントはP6~9)  ○ 総務省及び経済産業省における技術の検討状況     総務省(情報流通行政局)から、情報流通連携基盤に関する実証事業、オープン    データ流通推進コンソーシアム技術委員会等について発表     経済産業省から、DATA METI構想における技術の検討、「Open Data METI」    サイト等について発表  ○ データ・ワーキンググループの進め方     事務局から資料説明の後、意見交換 (ポイントはP10,11)

ニーズ例(gコンテンツ流通推進協議会のヒアリングから) 機械判読可能なデータ形式による公開への期待のポイント(1) 国内の産業界のニーズ(例:ボーリング情報) 分野 ニーズ例(gコンテンツ流通推進協議会のヒアリングから) リスクマネージメント 土壌汚染、地下水汚染などの分析に利用したい等(コンサルティング会社など) 価値の算出 積算時の適正価格の算出等(建設、損保、不動産など) 土木 断層や岩盤の分布や性状を把握することで、候補地や工法等を検討し建設計画を策定等(建設など) 防災 ハザードマップの精度の向上等(都市開発など) 公共工事 新規工事時の調査費の削減等(建築など) (民間事業者の利用したい形(例)) 統合地質図DB (産業技術総合研究所など) 【事業者】 ・シミュレーション解析(防災・災害・土地利用等) ・可視化(情報見える化) 等の実施 地質調査、柱状図情報 (国土交通省等) 統合して利用 (耐災害、サービスの高度化・創出) 柱状図等 (自治体)

機械判読可能なデータ形式による公開への期待のポイント(2) オープンデータ活用のステップ 行政情報は営利・非営利を問わず、積極的に利用し、新たな価値(サービス、効果、産業など)を生み出していくことが必要です。そのためには、行政機関・公共関係機関・民間企業と連携し、 個人情報や企業情報の活用、データの標準化、データの対価の考え方などを指針として整理すると共に、具体的なビジネスケースを創出することが必要ではないかと考えています。 公共団体 自治体 ◎公開できるデータのカタログ化 ◎ データ形式およびその表現方法の標準化やツール作成、指針の策定 ◎利用条件(著作権、個人情報の扱いなど)の明確化 など 集積情報など 届出情報など 機械判読可能な形での公開 ◎データ融合による付加価値の定性的・定量的評価 ◎利用条件の検証 など 民間事業者 ソーシャルによる情報の更新など 事業者情報との融合 サービス利用(高度化、創出、融合) 車両の進行方向に 合わせた駐輪場誘導 狭域空間(屋内外)の商業利用 非常時の情報提供 ◎ビジネス化の検証 ◎ビジネスの継続実施      など

機械判読可能なデータ形式による公開への期待のポイント(3) 加速する一つの提案 データを利用する事業者が困っている代表的なものが、“コードを一致させる手作業”です(gコンテンツ流通推進協議会ヒアリングによる)。民間で流通しているデータを、行政コードと合わせるコスト(手間)が大きく、電子行政オープンデータ戦略によるデータ利用の促進に期待しています。 データの利活用によって、産業界では“データ到達コストの圧縮”、“これまで使えなかったデータの利用機会の獲得”を期待しています。特に、利活用の促進にあたり、政府・行政機関のコードの活用のし易さが加速されることを期待しています。 【第一段階】  政府・行政機関が保有するコードの機械可読形式での公開  (例)日本標準産業分類、日本標準職業分類、職員等利用者認証業務・システム    (GIMA)の組織コード、地方公共団体コード、法人登記コード、地理空間     情報に係るコード等 【第二段階】  公開されたコードをURI(Uniform Resource Identifier)記述し、公開  (これによって、RDF(Resource Description Framework)を用いた情報の  連携が可能になる)  (例)地方公共団体コードURI化し、RDFで関係記述できるようになれば、時系    列の公式な地名変遷や、各時代ごとの俗称等との関係技術が可能になる。     記述例:jisx0402.org/131202/2012(北海道札幌市中央区の場合)

データ形式・構造、データカタログに関する技術のポイント(1) ●機械判読可能なデータとは、データ形式や構造の仕様が公開され、そのデータを判読処理するプログラムを、第三者が作成できるデータである。  ※コンピュータが自動的にデータを再利用するためには、コンピュータが、当該データの論理的な構造を識別(判読)でき、構造中の値  (表の中に入っている数値やテキスト、等)が処理できるようになっている必要がある。 ●機械判読不可なデータとは、データを利用したいプログラムが、そのデータの論理的な構造を識別(判読)できないデータ(データを人に対し表示するプログラムが存在しても、内容が取り出せない) ※ 機械判読不可なデータも、データビューア・プログラムを利用することで、人は判読可能。 <関連技術の位置づけ> 人が必要な データを探せる 人が理解できる 文書(データ)の形式 利用者(人) 文書ビューアや 文書エディタ を利用して人が読む 利用者 ロウデータ (手を加えていないデータ) 素材データ ・素材文書 ・素材画像 人が理解する ための 公開文書 ホームページ情報 (人向け) データカタログ (機械向け) 加工、 作成 その まま 公開 処理等 HP作成 再加工 利用者(機械) プログラムが データを読み 二次利用する 機械判読可能な 公開データ カタログ 機械が必要なデータを探せる 機械判読可能なデータ仕様に沿って作成してある ③データカタログ (機械がデータを横断検索でき、  機械がデータにアクセスできる) ①機械判読可能なデータ形式 ②データの融合を可能にする   ためのデータ構造

参考)Linked Open Data 5star データ形式・構造、データカタログに関する技術のポイント(2)  「オープンデータの5つの段階(出典:★ )」と、データ形式 段階 公開の状態 データ形式例 参考)Linked Open Data 5star 1段階 オープンライセンスの元、データを公開 PDF、JPG OL – Open License (計算機により参照できる(可読)) 2段階 1段階に加え、コンピュータで処理可能なデータで公開 xls、doc RE – Readable         (Human & Machine) (コンピュータでデータが編集可能) 3段階 2段階に加え、オープンに利用できるフォーマットでデータ公開 XML、CSV OF – Open Format (アプリケーションに依存しない形式) 4段階 Web標準(RDF等)のフォーマットでデータ公開 RDF、XML URI – Universal Resource               Identifier (リソースのユニーク化、Webリンク) 5段階 4段階が外部連携可能な状態でデータを 公開 LoD、RDFスキーマ LD – Linked Data (データ間の融合情報が規定。検索可能) 人が理解 するための 公開文書 (編集不可) 公開文書 (編集可) 機械判読可能な 公開データ オープンデータの5つの段階 出典:★ Open Dataのサイト(http://5stardata.info/)およびTim Berners-Lee氏のLinked Dataに関する提言ページ (http://www.w3.org/DesignIssues/LinkedData.html)を参考に作成。 

データ形式・構造、データカタログに関する技術のポイント(3) 公開データのデータ横断利用と融合型利用の考え方 ◎公開データの利用では、以下のような利用が想定される。  ・利用例1: 異なる組織や年度別に公開されたデータをまとめて処理。(横断利用) ・利用例2: 異なるデータ構造の公開データ間を融合キーで融合し、それぞれのデータ項目   の値を組み合わせて利用(融合利用) 例)地図データの位置情報に農産物出荷量を融合 データの融合のために必要な事項 ◎データ構造(項目)を共通化することで、データを融合することが可能。 ◎異なるデータ構造であっても、同じデータ項目がある(表記が異なっていても同じものを意味して  いる項目がある)ことが分かれば、データの融合は可能。   特にデータ項目の値としてのコードについては、融合処理の機械処理を効率化させるために重要  な要素である。  ◎海外のデータと融合させるためには、国際標準データ項目辞書(例 ISO 15022等)のデータ  項目セットや、国際標準コード体系のデータ項目とコードを利用すると、データの融合が、広範囲に  実施可能。 ◎近年、データ項目の概念(リソース)のユニーク化として、RDFの技術が普及してきている。   次世代の技術として、利用検討すべきである。  URI – Universal Resource Identifier 異なる管理組織間のデータも融合キー化が可能  LOD – Linked Open Data 異なるデータ項目間の関連情報が規定でき、高度な融合が可能

データ形式・構造、データカタログに関する技術のポイント(4) (機械向け)データカタログに記載する内容 (想定)  ◎データカタログの内容は、利用する側の機械(プログラム)が、公開データとして「何があるか」、「どのような内容や形式か」、「どこにあるのか」を知るための情報となる。そのためには、カタログ検索、カタログ取得、データ取得等ができるWeb-API(※)も必要となる。 ◎データカタログの構成は、「データカタログ自体の書誌情報」、「公開データの形式情報」、「データ特性情報」等、である。 データカタログ形式 (XMLで規定)(スタイルシートで表示形式作成) 公開データ構造(形式) (XML表現、等) <データ構造><データ項目>情報 <公開データの書誌情報>  ・ダブリンコア(Dublin Core)基本要素等 <公開データの構造>  ・データ形式のURLの指定  ・独自のXMLやCSV形式等の指定 <データの取得方法>  ・データの取得のURL形式(連続取得用) <融合キーとなる項目>  ・他の情報と融合できるデータ項目 <データ特性>  ・「鮮度」「粒度」「精度」「信頼度」等 <データ固有の特性>  ・アンケートデータや観測データ特性等 ◎◎予算情報 項目名 意味 文字属性 コード 組織 行政機関 集合項目   行政機関 府省庁名 政府機関コード   部局 部局名 文字列 予算 予算の総額 数値(百万円単位) 無し   当年 当年度予算   前年 前年度予算 <コード>情報 政府機関コード 値 意味 01 内閣府 02 内閣官房 Dublin Core : http://dublincore.org/ (※)Web-APIの候補としては、SOAP(WSDL)、JSON(JSONスクリプト)、REST形式(URL表現+XML)などがあり、     それぞれ特徴があるため、利用者側ユースケースを想定して採用仕様を決定する必要がある。

データWGにおける検討課題と検討の進め方のポイント 【データWGにおける検討課題(案)】  オープンデータに用いるデータ形式として利用できる規格は、既に様々なデータ規格(※)として確立している。機械判読の可能性やプログラムによる加工しやすさなど、技術的要件は既に広く知られている。  したがって、本WGでは、オープンデータ向けの新しいデータ規格を策定するのではなく、既に他の場で行われているデータ形式に関する議論やその成果を踏まえつつ、既存のデータ規格をどのような場面でどのように使うのか等に着目し、以下の事項について検討することが適当ではないか。 (※)オープンデータに利用可能なデータ規格には、RDF (Resource Description Format) 、XML (eXtensible Markup Language) 、   csv (Comma-Separated Values), JPEG (Joint Photographic Experts Group)など、特定企業規格に依らないものと、doc、docx、   xls、xlsx、PDFといった、特定企業由来のものがあり、政府のオープンデータにどれが適切かについては議論が必要。 データ形式・構造の標準化 データカタログ 現在のデータ形式をより機械判読が容易なものに変更・変換していくための手順 データカタログに求められる機能、構成 複数のデータを組み合わせて利用しやすくするための融合キー・共通コードの在り方 データカタログ掲載に当たり必要となるメタデータの在り方とデータカタログ掲載のための手順 機械判読が容易なデータ形式で公開されるデータの質・量の充実のための技術的手法(データの鮮度・精度の向上、加工前データの活用等) ロードマップ 実務者会議(親会)でロードマップを作成するに当たって必要となる事項の検討・整理

第1回データWGでの主な意見等 (実際のデータ公開に対するサポート等について)  ○ データホルダーがデータを出しやすくするという観点も重要。例えば、公開に際して   加工しているものは、加工前に作成しているデータを出せれば負担は小さい。  ○ 機械判読可能な形でのデータ公開のためには、ツールの検討も必要。  ○ 人向けのデータと機械向けのデータでは、作成に当たり気を付けるべき点が異な   る。機械向けにはメタデータが重要。  ○ 実務担当者が必要な作業を理解できるような手引書があるとよい。 (早期に取り組むべき課題について)  ○ 府省横断的な課題として、コードの共通化に取り組むのがよい。  ○ 各府省が保有するデータに係るコード、用語の定義が、現状どうなっているかの整   理から始めればどうか。  (検討の進め方について)  ○ 具体的な検討のためには、対象を絞った方がやりやすい。  ○ 会議以外に、ITを活用したニーズのくみ上げについても検討が必要。 (その他)  ○ 提供側には改変に対する不安がある。ルールや意識変革が必要。  ○ 実際の利用に当たっては、データの鮮度、信頼性が重要。  ○ データにアクセスするためのAPI も重要。