2013.12.04 オープンデータ流通推進コンソーシアム 事務局 オープンデータ流通推進コンソーシアム 「オープンデータ化のための技術 ガイド」作成案 平成 25 年度第 1 回 技術委員会資料 資料 1-6.

Slides:



Advertisements
Similar presentations
オープンデータ流通推進コンソーシアム 事務局 オープンデータ流通推進コンソーシアム オープンデータ化の評価指標案 平成 25 年度技術委員会 第2回 技術委員会資料 資料 2-7 抜粋 参考資料 4.
Advertisements

オープンデータ流通推進コンソーシアム 事務局 オープンデータ流通推進コンソーシアム オープンデータ化の評価指標案 平成 25 年度技術委員会 資料 2-7.
オープン&ビッグデータ活用・地方創生推進機構 事務局 オープン&ビッグデータ活用・地方創生推進機構 自治体条例調査資料 平成26年度 第1回データガバナンス委員会資料 資料1-6.
オープン&ビッグデータ活用・地方創生推進機構 事務局 オープン&ビッグデータ活用・地方創生推進機構 民間保有データの有効活用に関する意見の とりまとめ 平成26年度 第2回データガバナンス委員会資料 資料4.
オープン&ビッグデータ活用・地方創生推進機構 事務局 オープン&ビッグデータ活用・地方創生推進機構 技術委員会活動報告 平成26年度 第1回技術委員会資料 資料1-4.
5 月 28 日 説明会 1 Kiwi-W コンソーシアム 設立説明会 Kiwi-W コンソーシアム設立準備委員会 アイシン・エイ・ダブリュ株式会社 インクリメント P 株式会社 株式会社ザナヴィ・インフォマティク ス 株式会社ゼンリン 株式会社デンソー 株式会社本田技術研究所 三菱電機株式会社 株式会社トヨタマップマスター.
Integrated Personal Page C05823 森本万里子 C05829 西山礼恵 C05899 高木華子.
オープンデータ流通推進コンソーシアム 事務局 オープンデータ流通推進コンソーシアム オープンデータ化のための技術ガ イド骨子案 平成 25 年度技術委員会 資料 2-5.
オープン&ビッグデータ活用・地方創生推進機構 事務局 オープン&ビッグデータ活用・地方創生推進機構 評価版ツールの状況報告 平成26年度第3回 技術委員会 資料3-1.
3. 写真・ CAD 図面について. 2 成果品のファイル形式 委託業務 ファイル形式 管理ファイル業務管理ファイル XML 各フォルダ管理ファイル XML 成果品文書ファイル等オリジナル形式 doc ・ jtd ・ xls 等 pdf 形式 pdf 図面ファイルオリジナル形式 dxf ・ dwg.
オープンデータ流通推進コンソーシアム オープンデータ化のための技術ガイド骨子案
(平成26年1月24日 第5回電子行政オープンデータ実務者会議 総務省提出資料)
Webサービスに関する基本用語 Masatoshi Ohishi / NAOJ & Sokendai
資料4-3 オープンデータガイド(活用編) 概要
資料1-6 技術標準仕様案
オープンデータ流通推進コンソーシアム 情報流通連携基盤外部仕様書の 改訂案
資料1-4 平成27年度 第1回技術委員会 2015年度技術委員会の目標と 検討項目(案)
地方公共団体オープンデータ推進ガイドライン および手引書の見直し(案)
電子行政オープンデータ推進のためのロードマップ(工程表)
【資料3】 条例検討会議について 平成28年8月30日 福岡市障がい者在宅支援課.
オープンデータ流通推進コンソーシアム オープンデータ化ガイド 概要(共通部・技術編)
NIIメタデータデータベースの構想 国立情報学研究所 開発・事業部 コンテンツ課 米 澤 誠
資料4-3 平成26年度第3回 技術委員会 外部仕様書・ツール群の状況報告
オープンデータ流通推進コンソーシアム データガバナンス委員会 利活用・普及委員会 実施報告
2016年3月10日(木) 内閣官房 情報通信技術(IT)総合戦略室
空間メタデータ整備 における課題 園山 実 三菱総合研究所.
1.技術委員会の取組と提言 オープンデータ流通推進コンソーシアム 技術委員会主査 越塚 登.
オープンデータ流通推進コンソーシアム 技術委員会の検討状況報告
Windows Summit /8/2017 © 2010 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be.
SGMLについて 2年8組  原口 文晃.
オープンデータ流通推進コンソーシアム オープンデータ化の評価指標案
実際にたたいてAPI APIの初歩からプログラムまで使用方法のAtoZ.
昨年度VLEDの取組み 対象データ ・道路通行規制情報 ・食品営業許可情報 ・地盤情報(ボーリングデータ・土質試験結果など)
オープンデータ流通推進コンソーシアム オープンデータ化のためのCSVデータ規格案
第10回 2007年6月29日 応用Java (Java/XML).
図書館職員のための アプリケーション開発講習会
行政保有データ(統計関連)の棚卸し集計結果 (平成29年12月取りまとめ)
資料1-6 平成26年度 第1回技術委員会資料 支援ツール群整備方針
Microsoft Visual Studio 2005 Tools for
オープンデータ流通推進コンソーシアム 技術委員会のミッションと検討内容
Windows Summit /24/2019 © 2010 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be.
独習XML ~第3章 文書と構造~ 3.3 スキーマ 3.3 XML Schema
Mappin’ Drop 防災 減災 少子 高齢 産業 創出 Mappin’ Drop 誕生の キッカケ
オープンデータガイド第1版 ~オープンデータのためのルール・技術の手引き~技術編
第1章 実世界のモデル化と形式化 3.地物インスタンスの表現
外部仕様書・オープンデータガイド精査方針
資料1-5 平成26年度 第1回データガバナンス委員会資料 平成26年度検討事項(案)
クリアリングハウスと 空間データ交換システムの連携 - メタデータとXML - 平成11年2月10日 (株) NTTデータ 情報科学研究所
資料6 平成24年度活動報告と平成25年度活動計画案 オープンデータ流通推進コンソーシアム事務局.
XML Schema (1) ソフトウェア特論 第3回 /
「政府標準利用規約(第2.0版)」の概要 「政府標準利用規約(第2.0版)」の概要は以下のとおり。 1.基本的なコンテンツの利用ルール
平成25年度オープンデータ実証実験 自治体行政情報実証(概要)
行政保有データ(統計関連)の棚卸し結果概要 (平成29年12月取りまとめ)
資料2-2 平成26年度 第2回技術委員会資料 次年度検討テーマ案
平成29年10月30日 内閣官房情報通信技術(IT)総合戦略室
地方公共団体オープンデータ推進ガイドラインの概要
「政府標準利用規約(第1.0版)」の概要 「政府標準利用規約(第1.0版)」の概要は以下のとおり。 1.基本的なコンテンツの利用ルール
Windows Summit 2010 © 2010 Microsoft Corporation.All rights reserved.Microsoft、Windows、Windows Vista およびその他の製品名は、米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です。
公共データWGにおける 利用条件等に関する検討状況等について
DATA METI構想を進めていくためのロードマップ(工程表)(案)
電子行政オープンデータ推進のためのロードマップの概要
(平成25年6月25日 各府省情報化統括責任者(CIO)連絡会議決定)
オープンデータに関する 経済産業省の取組と提言
平成25年度オープンデータ実証実験 統計情報・データカタログ実証(概要)
資料3-2 平成26年度 第3回技術委員会資料 次年度テーマの検討
オープンデータリーダ育成研修 資料集 講義ノート:
オープンデータ流通推進コンソーシアム オープンデータ化のためのCSVデータ規格案
第2回実務者会議の議論を受けた検討(データWG関係)
資料2 2 政府標準利用規約(1.0版)の見直し.
オープンデータ流通推進コンソーシアム 情報流通連携基盤・外部仕様書 (平成24年度版) Call for Comment結果報告
Presentation transcript:

オープンデータ流通推進コンソーシアム 事務局 オープンデータ流通推進コンソーシアム 「オープンデータ化のための技術 ガイド」作成案 平成 25 年度第 1 回 技術委員会資料 資料 1-6

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 背景と目的 ■作成の背景 ▶ 政府等によるオープンデータ化の推進  電子行政オープンデータ推進のためのロードマップ(電子行政オープンデータ実務者会議)  Open Data METI(経済産業省)  情報通信白書のオープンデータ化(総務省)  自治体によるオープンデータ化への取組(鯖江市・横浜市・流山市など) ▶ 政府・自治体職員がオープンデータ化を実施するうえでのガイドが必要  当委員会において「オープンデータ化のためのデータ作成に関する技術ガイド」を作成  電子行政オープンデータ実務者会議において「数値(表)、文章、地理空間情報のデータ作成に当た っての留意事項」を作成  本文書の内容は「実務者会議の議論の進展や関連技術の進展を踏まえ、随時改定する」とある(電子行政オープン データ実務者会議・二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)の概要) ■作成の目的 ▶ 昨年度のガイド・留意事項文書を精査し、政府・自治体職員がオープンデータ化を実 施するうえで使いやすいガイドの作成を目指す。 2

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 「オープンデータ化のための技術ガイド」目次案 1.はじめに ▶ 技術ガイドの位置づけや、記載概要を示す。 2.オープンデータ化の意義 ▶ オープンデータ化の背景と経緯を述べる。 3.オープンデータに関する技術背景・要求 ▶ オープンデータ化に際して参考になる技術や規格を列記し、それらを解説する。  識別子に関する規格についても、ここで解説する。 4.オープンデータ化のための技術的指針 ▶ 表形式/文書/地理データ/リアルタイムデータのそれぞれの形式ごとに、オープンデータ化を行う上 での留意事項や推奨事項を解説する。  昨年度のガイドは、この部分のみが記載されていた。 ▶ メタデータを記述するための手法や留意事項、推奨事項を解説する。  Word/Excel/PDF等のプロパティ、Simple Data Format、データカタログの表現など。 ■上記構成を提案する理由 ▶ 実務担当者がオープンデータ化を進める際には、オープンデータ化の技術背景を理解する必要がある。 このため、これらの背景に関する解説を追記する。 ▶ データ形式については、国内外で広く利用されている規格がすでにある。 それらの調査結果を技術ガイドに反映させる。 3 データガバナンス委員会で 検討中の、データガバナンスの ガイドと整合性をとる。 昨年度版のガイド に追加する。

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 参考とする識別子規格 ■調査の指標(  データを識別するうえでの要求事項) ▶ URI表現可能性(RDFで利用できるか) ▶ 唯一性保証の方法 ▶ 識別対象 ▶ 永続性 ▶ ID長(可変・固定) ▶ 他の識別子体系の取り込み可能性 ▶ 運営主体(利用するための手続きなど) ▶ 連番・分散管理の可能性など ■調査対象とする識別子案 ▶ ucode [ITU-T H.642.1] ▶ EPC SGTIN/SSCC/SGLN ▶ DoI (Digital Object Identifiers) [ISO 26234] ▶ UUID [ISO/IEC 11578] ▶ ISBN [ISO 2108] / ISSN [ISO 3279] ▶ 企業コード [ISO 6523] ▶ 国名コード [ISO ] / 行政区画コード [ISO ] ▶ OpenID ▶ RFIDの固有ID [ISO/IEC 15963]など ■調査結果は次回報告する 4

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 参考とするファイル形式規格 ■表形式データ ▶ Common Format and MIME Type for Comma-Separated Values (CSV) Files [RFC 4180] ▶ Simple Data Format ▶ Linked CSV ■地理空間データ ▶ GML ▶ KML ▶ shape ■リアルタイムデータ ▶ Stream API ▶ GTFS(General Transit Feed Spec)Realtime 5

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 表形式データに関する参考企画 (1/3: RFC 4180) ■RFC4180 (*1) の概要 ▶ CSV(Comma-Separated Values)ファイルの書式と、それに関連づけられる MIMEタイプ(text/csv)を規定している。  CSV形式の仕様と実装は多岐に渡っており、公式な仕様はない。RFC4180は、殆どの実装が解釈 可能なCSV形式の書式を規定している。 ▶ CSV形式のフォーマットだけでなく、ヘッダ行に関する規定もある。  There maybe an optional header line appearing as the first line of the file with the same format as normal record lines. This header will contain names corresponding to the fields in the file and should contain the same number of fields as the records in the rest of the file (the presence or absence of the header line should be indicated via the optional "header" parameter of this MIME type). ■平成24年度版技術ガイドとの関連 ▶ RFC4180では、ヘッダ(表のタイトル部分)を最大1行にするように求めている。 ▶ 一方、平成24年度版技術ガイド9「データセルの内容・単位・記数単位を示すタイ トルが、それぞれ別の行に記載されている」を満たすと、RFC4180に準拠しなくな る。  Simple Data Format 6 (*1) Y. Shafranovich. Common Format and MIME Type for Comma-Separated Values (CSV) Files. RFC 4180,

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 表形式データに関する参考企画 (2/3: Simple Data Format) ■Simple Data Format (*2) の概要 ▶ Data Packages (*3) やJSON Table Schema (*4) 等の規格を参照している。 ▶ 以下のようなフィールドを利用して、CSV形式データの(メタデータ)定義をJSON形式で 行う。 ▶ name(データ名) ▶ licenses(ライセンス) ▶ datapackages_version(バージョン) ▶ resources(CSVファイルの定義)  url(データのURL)  path(データのパス)  schema(urlまたはpathが示すCSVデータの定義)  fields(CSVデータのカラム定義) name(カラム名) type(データ型/string, number, integer, date, time, datetime, boolean, binary, object, geopoint, geojson, array, any) description(カラムの説明) ▶ フィールド名にボキャブラリを割り当てれば、RDFによる メタデータ表記にもなり得る。 7 (*2) (*3) (*4)

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 表形式データに関する参考企画 (2/3: Simple Data Format) ■Simple Data Formatによる記述例 8 { "name": "my-dataset", "resources": [ { "path": "data.csv", "schema": { "fields": [ { "name": "var1", "type": "string" }, { "name": "var2", "type": "integer" }, { "name": "var3", "type": "number" } ] } ] } データセット名 “my-dataset” データファイルのパス情報 “data.csv” カラム定義 第1カラム: 「var1」という名前の文字列情報 第2カラム: 「var2」という名前の整数情報 第3カラム: 「var2」という名前の数値情報

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 表形式データに関する参考企画 (3/3: Linked CSV) ■Linked CSV (*5) の概要 ▶ RDF化を意識したCSVデータを記述フォーマットを規定しようとしている。  ヘッダとデータ本体の間にメタ情報(type、see、langなど)を記述する。  記述例(可読性を確保するためにCSVデータを表形式で示す) ▶ ただし、厳密にはこの記法はRFC4180に準拠していない 9 #countryyearpopulation typeurltimeinteger metaindexurl/populations metalicenseurlhttp://creativecommons.org/publicdomain/mark/1.0/ : <> rel:describedby, ; :index ; :license ;. ヘッダ [ rel:describedby ; :country ; :year "1960"^^xsd:gYear ; :population ] [ rel:describedby ; :country ; :year "1961"^^xsd:gYear ; :population ] メタ情報 データ本体 RDF化 (*5) Jeni Tennison. Linked CSV,

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 地理空間データに関する参考規格 ■GML (Geography Markup Language) ▶ Open Geospatial Consortium (OGC)によって開発された、地理的特徴を表現する XMLベースのマークアップ言語。 ▶ ISO 19136として標準化されている。 ▶ データ構造は、RDFに準拠している。 ▶ 平成20年4月から国土地理院が提供している基盤地図情報は、この形式で提供され ている。 ■KML (OGC KML) ▶ Open Geospatial Consortium (OGC)が規格化する、地理的特徴を表現する XML ベースのマークアップ言語。 ▶ Google EarthやGoogle Maps、Google Mobileなどで利用されている。 ■shape ▶ 米国ESRI社の提唱する、ベクトル形式のGIS標準データフォーマット形式。 ▶ 国際標準化規格ではないが、業界標準フォーマットの1つになっている。 10

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. リアルタイムデータに関する参考規格 ■Streams API(*6) ▶ サーバ・クライアント間でのHTTPコネクションを継続し、値が更新されるごとにそ の結果を返す仕組み。 ▶ TwitterやTransport for Londonなどで利用されている。 ■ GTFS(General Transit Feed Spec)Realtime ▶ GTFSは、公共交通機関の時刻表とその地理的情報に使用される共通形式。 ▶ GTFS Realtimeは、公共交通機関が運行車両に関するリアルタイムの最新情報をア プリケーション デベロッパーに提供できるようにするためのフィードの仕様。 11 (*6) Feras Moussa. Streams API

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved. 「オープンデータ化のための技術ガイド」 : 昨年度部分の精査方針案 ■表形式データ ▶ 以下に代表される、各種規格との整合性・互換性を確認し、必要な修正を加える。  RFC4180: Common Format and MIME Type for Comma-Separated Values (CSV) Files  Simple Data Format ■地理空間データ ▶ 既存のフォーマットや、それらの利用方法についての解説を追加する。  GML  KML  shape など ■文書データ ▶ 文字列の抽出・検索に関する方式を調査し、必要な修正を加える。 ■リアルタイムデータ ▶ リアルタイムデータの記述・配信機構に対応した代表的な規格に関する解説を追加 する。  Stream API  GTFS(General Transit Feed Spec) Realtime など 12

オープンデータ流通推進コンソーシアム © 2013 Open Data Promotion Consortium. All Rights Reserved.