総務省オープンデータ実証実験での取組 ~データカタログサイトの本格運用に向けて~ 平成26年1月21日 総務省 情報流通行政局 IT総合戦略本部 電子行政オープンデータ実務者会議 第4回 データ・ワーキンググループ提出資料 資料5 総務省オープンデータ実証実験での取組 ~データカタログサイトの本格運用に向けて~ 平成26年1月21日 総務省 情報流通行政局 情報流通振興課
【目次】 1.オープンデータ実証実験の概要 (1)全体概要 (2)実証実験の例 ①統計情報・データカタログ実証 ②自治体行政情報実証 (3)オープンデータ・アプリコンテスト 2.オープンデータ実証実験での取組と 政府データカタログサイトの本格運用に向けた示唆 (1)開発者向けサイト (2)メタデータ (3)API (4)データカタログサイトと他のデータベースとの連携
1.オープンデータ実証実験の概要
1.オープンデータ実証実験の概要 (1)全体像 1.オープンデータ実証実験の概要 (1)全体像 ○ 分野を超えたデータの流通・連携・利活用を効果的に行うために必要となる、①情報流通連携基盤共通API※(標準データ規格・標準API規格)の確立・国際標準化、②データの2次利用に関するルール(データガバナンス方式)の策定、③オープンデータ化のメリットの可視化等のための実証実験を実施。 ※共通API(Application Programming Interface):情報・データの相互運用性を確保するための共通のデータ形式や通信規約 【イメージ図】 <防災情報サービス> <公共交通情報サービス> <地盤情報サービス> 浸水危険エリア 国・県・市町村の 地盤情報を一覧表示 遅延情報 避難勧告エリア リアルタイム 位置情報 様々な情報の組み合わせ 情報流通連携基盤共通API 自治体行政情報 社会資本情報 観光情報 防災情報 公共交通情報 統計情報 花粉症情報 ・ 情報流通連携基盤共通API(第1版)について、平成24年度の実証実験の結果等を踏まえ、意見募集(Call for Comment)を実施(平成25年10月10日まで)。http://www.opendata.gr.jp/cfc/ ・ 平成25年度は、年度末の情報流通連携基盤共通API(第2版)の策定に向けて、統計情報・データカタログ実証、自治体行政情報実証、社会資本実証、観光実証、防災実証等、7本の実証実験を実施中。
【参考】 情報流通連携基盤共通APIの意義 【参考】 情報流通連携基盤共通APIの意義 2017/3/3 情報流通連携基盤共通APIは、(1)標準データ規格(データモデル、データ表現形式、共通ボキャブラリ)、(2)標準API規格から構成。 各組織のデータ形式がばらばらで、加工しづらい 機械可読なデータ形式に統一すること等で二次利用が容易に。 公開主体A 【標準データ規格なし】 公開主体B 公開主体C 【標準データ規格あり】 ○○市人口統計 … PDF 1985年,1234人 1986年,1385人 CSV 昭和60年,10.4千人 昭和61年,12.3千人 <dc:date>1985-04-01</dc:date> <rdf:value>52345</rdf:value> 標準データ規格 <rdf:value>12345</rdf:value> <rdf:value>10425</rdf:value> 52345 53854 昭和60 昭和61 人口統計 データ要求 DB 【標準API規格なし】 【標準API規格あり】 公開主体X 公開主体Y 公開主体Z 公開主体X 公開主体Y 公開主体Z DB DB DB DB 標準APIやDBの実装方法は、標準API規格の範囲外。 DB DB 独自API 独自API 独自API 標準API 標準API 独自API Y用の 問い合わせ 標準API X用の 問い合わせ Z用の 問い合わせ 既存の独自APIに標準 APIを被せてもよい。 また、サービスが独自に APIを提供することを妨げない。 ・サービスごとにデータの取得方法を調査し、アクセスする必要 ・データの取得先もサービスごとに違う ・データ提供元によらず共通の問い合わせ形式でアクセス可能 ・データの識別子から、そのデータの取得先を問い合わせられる トータルコストが上昇
1.オープンデータ実証実験の概要 (2)例①:統計情報・データカタログ実証(概要) 1.オープンデータ実証実験の概要 (2)例①:統計情報・データカタログ実証(概要) ○ オープンデータの利活用ニーズが高いと想定される、統計情報(次世代統計利用システムで提供されてるもの)や政府データカタログサイト(試行版)と情報流通連携基盤システムを接続し、両者の連携可能性を実証する。 ○ これにより、次世代統計利用システムや政府データカタログサイト(試行版)が提供するデータと他のデータとをマッシュアップが可能となる環境を実現する。 ○ また、統計情報については、従来は統計表ごとに検索していた、複数の統計表に対する統計情報検索を、情報流通連携基盤共通APIを1回呼び出すことで実現させることにより、統計情報の取得を簡素化することを目指す。 実施主体: 株式会社横須賀テレコムリサーチパーク 連携主体: 内閣官房、総務省統計局、独立行政法人統計センター 開発者サイト API仕様 サンプルコード 利用規約 等 コンテストによるアプリケーション 提供 複数の統計表に対する 検索を要求 結果を返却 情報流通連携基盤共通API 個々の統計表に対して 検索を要求 次世代統計利用システムAPI データカタログAPI … 統計 表#1 統計 表#2 統計 表#n 統計情報 データカタログ情報 本実証で扱うデータ 5
1.オープンデータ実証実験の概要 (2)例②:自治体行政情報実証(概要) 1.オープンデータ実証実験の概要 (2)例②:自治体行政情報実証(概要) 2017/3/3 ○ ユーザニーズに基づいた自治体版の「情報流通連携基盤システム」を構築し、広く地方公共団体に普及展開できるモデルを策定する。 ○ 広く普及展開可能なモデルを構築するためには、単に基盤システムを構築するだけでなく、情報流通連携基盤システムの設計思想のドキュメント化、ニーズの高い自治体行政情報の特定、ポータルサイトの構築、自治体職員向けの補助ツールの整備、情報サービスの構築によるメリットの可視化等を1つのパッケージとして整備する必要がある。 実施主体: エヌ・ティ・ティ・データ (LODイニシアティブ、日本マイクロソフト、インディゴ、jig.jp) 連携主体: 横浜市、鯖江市 【重点自治体行政情報の特定に係る調査等】 ・利活用ニーズの調査 ・展開可能性の調査 ・ニーズのあるサービス分野の調査 ・公開・二次利用不可根拠の調査 【データ規格の構築】 ・識別子の検討 ・ボキャブラリの構築 ・RDFスキーマの構築 【情報流通連携基盤システムの構築】 ・簡易なシステム設計 ・設計思想、手順のドキュメント化 ・API、自治体行政情報DBの構築 ・データ変換ツールの整備 ・自治体職員向けのマニュアルの整備 ・アンケート・ヒアリングによる基盤ステムの検証 【自治体行政情報のオープンデータ化の実証】 ・重点自治体行政情報のWeb公開・データカタログサイトの構築 ・コンテストによるアプリケーションの開発 サービス利用者 (地元住民) データ利用者 (情報サービス 開発事業者) CKANによるデータカタログサイト (横浜市・鯖江市) データ提供者 (自治体職員) ②所在確認 情報流通連携基盤システム ①登録 マニュアル データ変換ツール ③内容確認 ⑤サービス提供 ボキャブラリ RDFスキーマ ④データ取得 【アプリケーションの開発】 ・開発者サイト構築 自治体行政情報データベース 【継続運用・普及に係る計画の策定等】 【「オープンデータ流通推進コンソーシアム」との連携・協力等】 6
1.オープンデータ実証実験の概要 (3)オープンデータ・アプリコンテスト 1.オープンデータ実証実験の概要 (3)オープンデータ・アプリコンテスト ○ 総務省では、オープンデータのための技術・データの利用ルールの確立、オープンデータ化のメリットの可視化等のための実証実験を実施しているところ、民間における公共データの活用を促進するため、本年度実施中の7つの実証実験でオープンデータ化された公共データを活用したアプリケーションの開発を一般公募により実施。 ○ 応募のあったアプリケーションについて、オープンデータ流通推進コンソーシアムの利活用・普及委員会において審査を行い、優秀なものについては、平成26年3月13日開催予定の第4回同委員会において表彰を実施。 主催 総務省 及び オープンデータ流通推進コンソーシアム 株式会社エヌ・ティ・ティ・データ、富士通株式会社、日本アイ・ビー・エム株式会社、株式会社エヌ・ティ・ティ・データ経営研究所、株式会社パスコ、株式会社横須賀テレコムリサーチパーク、ウェザー・サービス株式会社 共催 後援 オープンストリートマップ・ファウンデーション・ジャパン 、 オープンナレッジファンデーションジャパン 、 クリエイティブ・コモンズ・ジャパン 、Code For Japan 、 Hack For Japan 、ビッグデータ・オープンデータ活用推進協議会 、特定非営利活動法人リンクト・オープン・データ・イニシアティブ、LODチャレンジ実行委員会、独立行政法人 国立高等専門学校機構、国土交通省、気象庁 ※その他調整中 表彰 実証実験・オープンデータ化される公共データ 実証実験 オープンデータ化される公共データ(例) 自治体行政情報実証 医療機関情報/バス停情報/AED設置場所 等 社会資本実証 工事実績/社会資本情報/苦情・問い合わせ 等 観光実証 観光情報/駐車場満空情報/タクシー平均移動時間 等 防災実証 避難所情報/過去の災害/ライフラインの被害・復旧情報 等 公共交通実証 遅延・運休等/走行位置/東京駅・新宿駅の構内施設 等 統計情報・データカタログ実証 総務省統計局所管の統計情報 政府データカタログサイト(試行版)の掲載情報 花粉症関連情報実証 花粉飛散量情報/気象情報/花粉症患者症状情報(統計処理済) 等 一般公募による アプリケーションの開発 情報流通連携基盤 共通API 自治体行政情報 スケジュール 花粉症情報 平成25年 11/28(木) 告知 平成26年 1月上旬~下旬 開発者サイト公開・データ提供開始 ※既に6実証について公開済み 2/3(月) 応募受付開始 2/17(月)正午【厳守】 応募締切 3/13(木)10時~12時 第4回 利活用・普及委員会 (受賞者によるプレゼンテーション、表彰式) 社会資本情報 統計情報 観光情報 公共交通情報 防災情報 ※詳細は、オープンデータ流通推進コンソーシアムのコンテスト専用ウェブサイト(http://www.opendata.gr.jp/2013contest/)を参照。
2.オープンデータ実証実験での取組と政府データカタログサイトの本格運用 に向けた示唆
2.オープンデータ実証実験での取組と示唆 (1)開発者向けサイト 2.オープンデータ実証実験での取組と示唆 (1)開発者向けサイト ○ 平成24年度に実施した公共交通オープンデータ実証では、開発者向けサイト(API仕様、サンプルコード、データ一覧、利用規約、FAQ、フォーラム機能等を掲載)を公開した上で、アプリケーション開発を一般公募したところ、わずか3週間で16のアプリケーションが開発された。 ○ 本年度は、全ての実証実験において、「開発者向けサイト」を用意し、「オープンデータ・アプリコンテスト」で提供。 ■統計情報・データカタログ実証の開発者向けサイト ■自治体行政情報実証の開発者向けサイト 示唆①:開発者向けサイト ○ 民間によるアプリケーションの作成等、オープンデータの利活用を促進するためには、単にデータを公開するだけではなく、開発者による開発のヒントとなる事項(API仕様、サンプルコード、データ一覧、利用規約、FAQ、フォーラム機能等)を掲載した「開発者向けサイト」を用意しておくことが重要。 9
【参考】 統計情報・データカタログ実証の開発者向けサイトが提供する機能 【参考】 統計情報・データカタログ実証の開発者向けサイトが提供する機能 【データ一覧】 ・ 本実証で利用できるデータ一覧を掲載 【API仕様・サンプルコード】 ・ アプリケーションを開発する際に必要となる、データのアクセス仕様 及びその利用方法をイメージ可能なサンプルコードを掲載 ・ 統計情報・データカタログ実証では、SPARQL(*1)準拠のAPIを提供 【フォーラム機能】 ・ 開発者間の意見交換機能を提供 (*1) RDF(*2)形式のデータに関する検索を行う言語。W3C (World Wide Web Consortium)が規格化している。 (*2) 主語・述語・目的語という3つの組でデータを記述する枠組み。W3Cが規格化している。 10
2.オープンデータ実証実験での取組と示唆 (2)メタデータ 2.オープンデータ実証実験での取組と示唆 (2)メタデータ ○ オープンデータ実証実験においては、メタデータの記述モデルにRDFを採用し、メタデータを記述するために利用するボキャブラリは、広く流通しているものを取り入れつつ、実証に必要なボキャブラリを追加定義する方針をとっている。 ○ 統計情報・データカタログ実証においても、統計情報の記述にはRDF Data Cube Vocabularyを、データカタログサイトに登録されているデータの記述にはData Catalog Vocabulary(DCAT)(いずれもW3Cが勧告済み)の各ボキャブラリを採用している。 ○ 政府のデータカタログサイト試行版も、DCAT等、国際標準に従って、メタデータ項目が作成されている。 ■政府データカタログサイト試行版に掲載されているデータのメタデータ表記例 「http://www.soumu.go.jp/main_content/000224888.pdf」に掲載されている、「総務省」が作成した「総務省所管予算の概要」というPDF資料に関する、データカタログサイトに格納されているメタデータは、以下のとおり(下記は、一部のメタデータを割愛している)。 dcat:distribution (参照先情報) dct:format (ファイルフォーマット) http://www.data.go.jp/data/dataset/soumu_05_ds_131126_00000001 rdf:type (データ型) rdf:type (データ型) rdf:type (データ型) dcat:Dataset (データセット) dcat:Distribution (リソース・参照先情報) dct:IMT (ファイルフォーマット) dcat:title (データセット名) rdf:value (フォーマット名) 予算_平成25年度 PDF dcat:accessURL (参照先URL) dct:keyword (キーワード・タグ) http://www.soumu.go.jp/main_content/ 000224888.pdf 財政 dct:creator (作成者) dcat:title (参照先情報名) foaf:name (作成者名) 総務省所管予算の概要 dct:relation (関連情報) 総務省 rdfs:label (属性名) publisher rdf:value (属性値) 大臣官房会計課 示唆②:メタデータ ○ メタデータを広く利用されているボキャブラリで記述するだけでなく、メタデータ項目の値の作成作業を効率化することも必要。具体的には、メタデータの値に関する一定の基準を設け、各府省の職員が各種データファイルを作成する際に、その基準に従いメタデータの値の記載も併せて行うようにする等、各府省の日常的な業務プロセスの中にメタデータ作成作業を位置づけておくことが有効。 ⇒ 「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)」(平成25年6月25日 各府省情報化統括責任者(CIO)連絡会議決定)の改訂。 ○ あわせて、そのメタデータの値を効率的にデータカタログに登録する方法についても検討が必要。 11
2.オープンデータ実証実験での取組と示唆 (3)API ○ オープンデータ実証実験では、単にデータを公開するだけでなく、アプリケーションから必要なデータを自動的に取得できるよう、API(Application Programming Interface)を用意。 ○ その際、データのマッシュアップを想定し、複数のデータベースから共通の方法によりデータ取得が可能となるよう、共通のAPI(情報流通連携基盤共通API)を用意。 ■情報流通連携基盤共通APIが提供するAPI機能一覧 広く利用されている規格を収集・列挙し、これらの規格との相互運用性を考慮しつつ、実証において必要になる機能を追加。 機能名 概要 SPARQLベースのAPI SPARQL-based command SPARQL1.1準拠のデータ操作APIを提供。 RESTベースのAPI Traceability/Realtime Data Management Command トレースフォワード・トレースバックを含む、トレーサビリティに代表されるイベントを管理する機能。 Geographical Data Management Command GIS等地理情報処理を必要とするデータ検索・取得・操作機能。 Notification Management Command データの登録・更新をトリガとしてデータ利用者のシステムにコールバックする(Notification)仕組み。 Security Management Command ユーザ・グループの管理と、データのアクセスルールに関する機能。 Vocabulary Management Command ボキャブラリ情報の登録・検索・取得に関する機能。 Triple Management Command RDFモデルの主語・述語・目的語からなる基本データの登録・検索・取得に関する機能。 Identification Resolution Command IDをキーとしてデータを登録・検索する機能。 示唆③:API ○ 民間によるアプリケーションの作成等、オープンデータの利活用を促進するためには、単にデータを公開するだけでなく、アプリケーションから必要なデータを自動的に取得できるよう、API(Application Programming Interface)を用意することが重要。 ○ マッシュアップを想定し、そのAPIの仕様は共通化しておくべき。 12
2.オープンデータ実証実験での取組と示唆 (4)データカタログサイトと他のデータベースとの連携 2.オープンデータ実証実験での取組と示唆 (4)データカタログサイトと他のデータベースとの連携 ○ 統計情報・データカタログ実証では、共通のAPIにより、既存のデータベースである次世代統計利用システムと、データカタログサイトとを連携させ、データのマッシュアップが可能となる環境を実現。 アプリケーション 共通のクエリ (SPARQLクエリ) 共通のレスポンス (SPARQLレスポンス) 情報流通連携基盤共通API 次世代統計利用システムAPI用 クエリ レスポンス データカタログAPI用 クエリ レスポンス 次世代統計利用システムAPI データカタログAPI 統計情報 データカタログ情報 示唆④:データカタログサイトと他のデータベースとの連携 ○ 既存データベースが存在する場合には、当該データベースのデータをカタログサイトに掲載する方法のほか、既存データベースとカタログサイトに共通のAPIを用意し、開発者が共通の問い合わせ方式によりデータ取得可能な環境を用意する方法も考えられる。 13