Presentation is loading. Please wait.

Presentation is loading. Please wait.

第1回データWGの開催概要 1 開催日 平成24年12月26日(水)

Similar presentations


Presentation on theme: "第1回データWGの開催概要 1 開催日 平成24年12月26日(水)"— Presentation transcript:

0 第2回実務者会議資料 資料1 第1回データ・ワーキンググループの 概要 2013年1月15日 事務局

1 第1回データWGの開催概要 1 開催日 平成24年12月26日(水)
1 開催日  平成24年12月26日(水) 2 参加者  データWG構成員 (※当日は、国土地理院及び気象庁は代理出席) 3 主な議事  ○ 機械判読可能なデータ形式による公開への期待     坂下構成員から発表 (ポイントはP3~5)  ○ データ形式・構造、データカタログに関する技術     小池WG主査代理から発表 (ポイントはP6~9)  ○ 総務省及び経済産業省における技術の検討状況     総務省(情報流通行政局)から、情報流通連携基盤に関する実証事業、オープン    データ流通推進コンソーシアム技術委員会等について発表     経済産業省から、DATA METI構想における技術の検討、「Open Data METI」    サイト等について発表  ○ データ・ワーキンググループの進め方     事務局から資料説明の後、意見交換 (ポイントはP10,11)

2 ニーズ例(gコンテンツ流通推進協議会のヒアリングから)
機械判読可能なデータ形式による公開への期待のポイント(1) 国内の産業界のニーズ(例:ボーリング情報) 分野 ニーズ例(gコンテンツ流通推進協議会のヒアリングから) リスクマネージメント 土壌汚染、地下水汚染などの分析に利用したい等(コンサルティング会社など) 価値の算出 積算時の適正価格の算出等(建設、損保、不動産など) 土木 断層や岩盤の分布や性状を把握することで、候補地や工法等を検討し建設計画を策定等(建設など) 防災 ハザードマップの精度の向上等(都市開発など) 公共工事 新規工事時の調査費の削減等(建築など) (民間事業者の利用したい形(例)) 統合地質図DB (産業技術総合研究所など) 【事業者】 ・シミュレーション解析(防災・災害・土地利用等) ・可視化(情報見える化) 等の実施 地質調査、柱状図情報 (国土交通省等) 統合して利用 (耐災害、サービスの高度化・創出) 柱状図等 (自治体)

3 機械判読可能なデータ形式による公開への期待のポイント(2)
オープンデータ活用のステップ 行政情報は営利・非営利を問わず、積極的に利用し、新たな価値(サービス、効果、産業など)を生み出していくことが必要です。そのためには、行政機関・公共関係機関・民間企業と連携し、 個人情報や企業情報の活用、データの標準化、データの対価の考え方などを指針として整理すると共に、具体的なビジネスケースを創出することが必要ではないかと考えています。 公共団体 自治体 ◎公開できるデータのカタログ化 ◎ データ形式およびその表現方法の標準化やツール作成、指針の策定 ◎利用条件(著作権、個人情報の扱いなど)の明確化 など 集積情報など 届出情報など 機械判読可能な形での公開 ◎データ融合による付加価値の定性的・定量的評価 ◎利用条件の検証 など 民間事業者 ソーシャルによる情報の更新など 事業者情報との融合 サービス利用(高度化、創出、融合) 車両の進行方向に 合わせた駐輪場誘導 狭域空間(屋内外)の商業利用 非常時の情報提供 ◎ビジネス化の検証 ◎ビジネスの継続実施      など

4 機械判読可能なデータ形式による公開への期待のポイント(3)
加速する一つの提案 データを利用する事業者が困っている代表的なものが、“コードを一致させる手作業”です(gコンテンツ流通推進協議会ヒアリングによる)。民間で流通しているデータを、行政コードと合わせるコスト(手間)が大きく、電子行政オープンデータ戦略によるデータ利用の促進に期待しています。 データの利活用によって、産業界では“データ到達コストの圧縮”、“これまで使えなかったデータの利用機会の獲得”を期待しています。特に、利活用の促進にあたり、政府・行政機関のコードの活用のし易さが加速されることを期待しています。 【第一段階】  政府・行政機関が保有するコードの機械可読形式での公開  (例)日本標準産業分類、日本標準職業分類、職員等利用者認証業務・システム    (GIMA)の組織コード、地方公共団体コード、法人登記コード、地理空間     情報に係るコード等 【第二段階】  公開されたコードをURI(Uniform Resource Identifier)記述し、公開  (これによって、RDF(Resource Description Framework)を用いた情報の  連携が可能になる)  (例)地方公共団体コードURI化し、RDFで関係記述できるようになれば、時系    列の公式な地名変遷や、各時代ごとの俗称等との関係技術が可能になる。     記述例:jisx0402.org/131202/2012(北海道札幌市中央区の場合)

5 データ形式・構造、データカタログに関する技術のポイント(1)
●機械判読可能なデータとは、データ形式や構造の仕様が公開され、そのデータを判読処理するプログラムを、第三者が作成できるデータである。  ※コンピュータが自動的にデータを再利用するためには、コンピュータが、当該データの論理的な構造を識別(判読)でき、構造中の値  (表の中に入っている数値やテキスト、等)が処理できるようになっている必要がある。 ●機械判読不可なデータとは、データを利用したいプログラムが、そのデータの論理的な構造を識別(判読)できないデータ(データを人に対し表示するプログラムが存在しても、内容が取り出せない) ※ 機械判読不可なデータも、データビューア・プログラムを利用することで、人は判読可能。 <関連技術の位置づけ> 人が必要な データを探せる 人が理解できる 文書(データ)の形式 利用者(人) 文書ビューアや 文書エディタ を利用して人が読む 利用者 ロウデータ (手を加えていないデータ) 素材データ ・素材文書 ・素材画像 人が理解する ための 公開文書 ホームページ情報 (人向け) データカタログ (機械向け) 加工、 作成 その まま 公開 処理等 HP作成 再加工 利用者(機械) プログラムが データを読み 二次利用する 機械判読可能な 公開データ カタログ 機械が必要なデータを探せる 機械判読可能なデータ仕様に沿って作成してある ③データカタログ (機械がデータを横断検索でき、  機械がデータにアクセスできる) ①機械判読可能なデータ形式 ②データの融合を可能にする   ためのデータ構造

6 参考)Linked Open Data 5star
データ形式・構造、データカタログに関する技術のポイント(2)  「オープンデータの5つの段階(出典:★ )」と、データ形式 段階 公開の状態 データ形式例 参考)Linked Open Data 5star 1段階 オープンライセンスの元、データを公開 PDF、JPG OL – Open License (計算機により参照できる(可読)) 2段階 1段階に加え、コンピュータで処理可能なデータで公開 xls、doc RE – Readable         (Human & Machine) (コンピュータでデータが編集可能) 3段階 2段階に加え、オープンに利用できるフォーマットでデータ公開 XML、CSV OF – Open Format (アプリケーションに依存しない形式) 4段階 Web標準(RDF等)のフォーマットでデータ公開 RDF、XML URI – Universal Resource               Identifier (リソースのユニーク化、Webリンク) 5段階 4段階が外部連携可能な状態でデータを 公開 LoD、RDFスキーマ LD – Linked Data (データ間の融合情報が規定。検索可能) 人が理解 するための 公開文書 (編集不可) 公開文書 (編集可) 機械判読可能な 公開データ オープンデータの5つの段階 出典:★ Open Dataのサイト( Berners-Lee氏のLinked Dataに関する提言ページ

7 データ形式・構造、データカタログに関する技術のポイント(3)
公開データのデータ横断利用と融合型利用の考え方 ◎公開データの利用では、以下のような利用が想定される。  ・利用例1: 異なる組織や年度別に公開されたデータをまとめて処理。(横断利用) ・利用例2: 異なるデータ構造の公開データ間を融合キーで融合し、それぞれのデータ項目   の値を組み合わせて利用(融合利用) 例)地図データの位置情報に農産物出荷量を融合 データの融合のために必要な事項 ◎データ構造(項目)を共通化することで、データを融合することが可能。 ◎異なるデータ構造であっても、同じデータ項目がある(表記が異なっていても同じものを意味して  いる項目がある)ことが分かれば、データの融合は可能。   特にデータ項目の値としてのコードについては、融合処理の機械処理を効率化させるために重要  な要素である。  ◎海外のデータと融合させるためには、国際標準データ項目辞書(例 ISO 15022等)のデータ  項目セットや、国際標準コード体系のデータ項目とコードを利用すると、データの融合が、広範囲に  実施可能。 ◎近年、データ項目の概念(リソース)のユニーク化として、RDFの技術が普及してきている。   次世代の技術として、利用検討すべきである。  URI – Universal Resource Identifier 異なる管理組織間のデータも融合キー化が可能  LOD – Linked Open Data 異なるデータ項目間の関連情報が規定でき、高度な融合が可能

8 データ形式・構造、データカタログに関する技術のポイント(4)
(機械向け)データカタログに記載する内容 (想定)  ◎データカタログの内容は、利用する側の機械(プログラム)が、公開データとして「何があるか」、「どのような内容や形式か」、「どこにあるのか」を知るための情報となる。そのためには、カタログ検索、カタログ取得、データ取得等ができるWeb-API(※)も必要となる。 ◎データカタログの構成は、「データカタログ自体の書誌情報」、「公開データの形式情報」、「データ特性情報」等、である。 データカタログ形式 (XMLで規定)(スタイルシートで表示形式作成) 公開データ構造(形式) (XML表現、等) <データ構造><データ項目>情報 <公開データの書誌情報>  ・ダブリンコア(Dublin Core)基本要素等 <公開データの構造>  ・データ形式のURLの指定  ・独自のXMLやCSV形式等の指定 <データの取得方法>  ・データの取得のURL形式(連続取得用) <融合キーとなる項目>  ・他の情報と融合できるデータ項目 <データ特性>  ・「鮮度」「粒度」「精度」「信頼度」等 <データ固有の特性>  ・アンケートデータや観測データ特性等 ◎◎予算情報 項目名 意味 文字属性 コード 組織 行政機関 集合項目   行政機関 府省庁名 政府機関コード   部局 部局名 文字列 予算 予算の総額 数値(百万円単位) 無し   当年 当年度予算   前年 前年度予算 <コード>情報 政府機関コード 意味 01 内閣府 02 内閣官房 Dublin Core :  (※)Web-APIの候補としては、SOAP(WSDL)、JSON(JSONスクリプト)、REST形式(URL表現+XML)などがあり、     それぞれ特徴があるため、利用者側ユースケースを想定して採用仕様を決定する必要がある。

9 データWGにおける検討課題と検討の進め方のポイント
【データWGにおける検討課題(案)】  オープンデータに用いるデータ形式として利用できる規格は、既に様々なデータ規格(※)として確立している。機械判読の可能性やプログラムによる加工しやすさなど、技術的要件は既に広く知られている。  したがって、本WGでは、オープンデータ向けの新しいデータ規格を策定するのではなく、既に他の場で行われているデータ形式に関する議論やその成果を踏まえつつ、既存のデータ規格をどのような場面でどのように使うのか等に着目し、以下の事項について検討することが適当ではないか。 (※)オープンデータに利用可能なデータ規格には、RDF (Resource Description Format) 、XML (eXtensible Markup Language) 、   csv (Comma-Separated Values), JPEG (Joint Photographic Experts Group)など、特定企業規格に依らないものと、doc、docx、   xls、xlsx、PDFといった、特定企業由来のものがあり、政府のオープンデータにどれが適切かについては議論が必要。 データ形式・構造の標準化 データカタログ 現在のデータ形式をより機械判読が容易なものに変更・変換していくための手順 データカタログに求められる機能、構成 複数のデータを組み合わせて利用しやすくするための融合キー・共通コードの在り方 データカタログ掲載に当たり必要となるメタデータの在り方とデータカタログ掲載のための手順 機械判読が容易なデータ形式で公開されるデータの質・量の充実のための技術的手法(データの鮮度・精度の向上、加工前データの活用等) ロードマップ 実務者会議(親会)でロードマップを作成するに当たって必要となる事項の検討・整理

10 第1回データWGでの主な意見等 (実際のデータ公開に対するサポート等について)
 ○ データホルダーがデータを出しやすくするという観点も重要。例えば、公開に際して   加工しているものは、加工前に作成しているデータを出せれば負担は小さい。  ○ 機械判読可能な形でのデータ公開のためには、ツールの検討も必要。  ○ 人向けのデータと機械向けのデータでは、作成に当たり気を付けるべき点が異な   る。機械向けにはメタデータが重要。  ○ 実務担当者が必要な作業を理解できるような手引書があるとよい。 (早期に取り組むべき課題について)  ○ 府省横断的な課題として、コードの共通化に取り組むのがよい。  ○ 各府省が保有するデータに係るコード、用語の定義が、現状どうなっているかの整   理から始めればどうか。  (検討の進め方について)  ○ 具体的な検討のためには、対象を絞った方がやりやすい。  ○ 会議以外に、ITを活用したニーズのくみ上げについても検討が必要。 (その他)  ○ 提供側には改変に対する不安がある。ルールや意識変革が必要。  ○ 実際の利用に当たっては、データの鮮度、信頼性が重要。  ○ データにアクセスするためのAPI も重要。


Download ppt "第1回データWGの開催概要 1 開催日 平成24年12月26日(水)"

Similar presentations


Ads by Google