参考資料6 平成26年3月18日 オープンデータ実務者会議データWG配布資料 情報共有基盤の推進状況について 平成26年4月1日 経済産業省
情報共有基盤とは 情報共有基盤とは、行政やオープンデータの利便性向上を図るため、「共通語彙基盤」「文字情報基盤」を合わせた取り組みにより実現される、関係機関間での情報共有の仕組みである。 オープンデータをマッシュアップするには、語彙や文字の共通化もしくは変換の仕組みが必要 シームレスな情報共有基盤 国・地方を通じた行政機関内での、住所、氏名、施設名等の語彙、さらには、氏名文字、法人文字の正確で効率的な交換が必要
参考:世界最先端IT 国家創造宣言工程表 ↓ ↓ 公共データの民間開放(オープンデータ)の推進 経済産業省 共通語彙の データベースを整備 ↓ データ連携のための基盤を作成 相互に連携 利便性の高い電子行政サービスの提供 総務省 情報流通連携基盤 共通APIの整備 ↓ 情報流通連携基盤を構築するための 規格を作成
検討体制 情報共有基盤の推進のため、専門家による委員会を設置。 オープンデータ視点での検討 ・・・ 協力依頼 報告 情報共有基盤推進委員会 IT総合戦略本部 新戦略推進 専門調査会 パーソナルデータに関する検討会 各府省CIO 連絡会議 電子行政オープンデータ実務者会議 情報セキュリティ 政策会議 電子行政 分科会 防災・減災 分科会 政府情報システム 刷新等WG ・・・ 塗りつぶし部分は関連する会議体 オープンデータ視点での検討 協力依頼 報告 IT融合フォーラム 公共データワーキング 情報共有基盤推進委員会 委員長 須藤修(東京大学情報学環長) 有識者 武田英明(共通語彙基盤WG座長)、林史典(文字情報基盤WG座長) 関係団体 JISA(ソフト業界)、JEITA(ハード業界) オブザーバ 内閣官房(IT総合戦略室、社会保障改革担当室)、総務省(行政管理局) 各委員会、WGの設置主体は経済産業省、事務局は(独)情報処理推進機構(IPA) 各WGの下には、具体的な検討を行なうSWGを設置。 共通語彙基盤WG <実施内容> 情報連携用語彙基盤DBの構築 APIカタログの整備 情報連携用ツールの整備 【主査】武田英明 (NII教授) 【関係省庁】(課長級) IT室、社保室、内閣府防災、 総務省、国交省、国会図書館 文字情報基盤WG <実施内容> 導入ガイドの作成 文字情報DBの構築 フォント整備 標準化の実施 【主査】林 史典(聖徳大学教授) 【関係省庁】(課長級) IT室、総務省、法務、省
共通語彙基盤
共通語彙基盤の現状① 平成6年 「行政情報化推進基本計画」閣議決定 平成6年 「行政情報化推進基本計画」閣議決定 省庁間の情報の共有及び円滑な流通に必要なデータコード、データ項目等基本的事項の標準化 平成24年 「IT防災ライフライン構築のための基本方針及びアクションプラン」IT戦略本部IT防災ライフライン推進協議会決定 公共情報交換標準スキーム(XMLベースの標準データ項目群)の検討を国際標準や国内の既存フォーマットも考慮しつつ連携させ、災害時等において必要な行政情報を迅速に提供するための検討を進め、実施可能な取組から実行する。 平成24年 「新たな情報通信技術戦略 工程表」IT戦略本部決定 データ活用を促進するためのフォーマット等の規範やマニュアルの整備、公共情報交換標準スキーム等の支援システム・ツールの実証を行う。 平成24年 共通語彙基盤(公共情報交換標準スキーム)に関する委員会を経済産業省内に設立
共通語彙基盤の現状② 平成25年 「世界最先端IT国家創造宣言」閣議決定 平成25年 「世界最先端IT国家創造宣言」閣議決定 データの組み合わせや横断的利用を容易とする共通の語彙の基盤構築に取り組む。 国民がステークホルダーとして積極的に参加できるよう、クラウドを活用したオープンな利用環境を、データ・フォーマット、用語、コード、文字等の標準化・共通化、APIの公開等を行いつつ整備する。 平成25年 「世界最先端IT国家創造宣言工程表」IT総合戦略本部決定 2015 年度までに情報連携用語彙データベース(基本語彙の定義等をまとめたデータベース)を開発・実証する。 国際的な連携を踏まえた情報連携用語彙データベース(基本語彙の定義等をまとめたデータベース)の開発・実証を2013 年度~2015 年度に行う。 平成25年 「電子行政オープンデータ推進のためのロードマップ」IT総合戦略本部決定 ある内容を示す用語や同じ用語の定義が組織によって異なっているとデータを横断的に又は組み合わせて処理・利用することが困難となるため、「新たな情報通信技術戦略 工程表」を参照しつつ、新たなIT 戦略の策定に伴って定めることとする分担に従い、用語やその定義の標準化、効率的なデータ連係のためのツール等の整備について、内閣官房、総務省及び経済産業省が連携して進める。 平成25年「情報連携用語彙データベース、ツールプロジェクト」開始
共通語彙基盤(IMI: Infrastructure for Multi-layer Interoperability)とは 情報を正しく効率的に交換、活用していくためには、人名、住所、物等、データを体系的、かつ、構造的に定義して行く必要がある。 システム連携 共通語彙基盤は、用語の参照辞書を整備することで、各種データの同一性の確認を容易にし、その結果として、システム間の連携やオープンデータの活用を容易にできるようにする仕組み。 情報交換パッケージにより、システム間を連携 ・高速な情報連携 ・設計の効率化 語彙(ボキャブラリ)、 情報交換パッケージ(IEP) オープンデータ 語彙で意味を確認し、情報交換パッケージから、情報を抽出 ・サービス設計の効率化 ・安定した情報連携 検索 語彙間の整理をしておくことで、検索を効果的に実施 ・検索の利便性の向上 ・効果的な広報の実施 Schema.org 検索エンジン大手が整備する 構造化データマークアップの共通仕様
共通語彙基盤の効果 共通語彙基盤を導入することにより、地域・組織・部門・業種・業務の壁を越えた横断的な情報連携やオープンデータ利活用が可能になると期待される。 情報連携・情報提供時の課題 共通語彙基盤の導入 共通語彙基盤(統一ルール) 自治体A 駅情報 病院情報 (通常時) 自治体B 公共交通 機関 病院情報 (通常時) 自治体A 駅情報 病院情報 (通常時) 自治体B 公共交通 機関 運行情報 病院情報 (通常時) × 運行情報 × 災害拠点 病院情報 × × 駅情報 × 災害拠点 病院情報 駅情報 バラバラの形式 統一の形式 アプリを 作りづらい! 情報が 見づらい! アプリの横展開が可能! 色々比較 しやすい! 情報提供主体や種別・役割ごとに表現形式やデータ形式が異なり一元的な情報活用が困難 同一施設の情報を(種別・役割によらず)一元的・横断的に活用可能
共通語彙基盤の構造 共通語彙基盤はコア語彙、共通語彙及びドメイン固有語彙から成り立つ。 コア 語彙 ドメイン共通語彙 ドメイン 固有語彙 どの分野でも利用される普遍的な語彙。 例)人、物、場所、日付 など 地理空間 ・施設 病院 移動 ・交通 ドメイン共通語彙 分野固有の語彙の内、他の分野でも参照する主要な語彙。 例)病院、駅名、避難所 など コア 語彙 住所 駅 避難所 防災 ドメイン共通語彙 災害 復旧費 ドメイン 固有語彙 財務 ドメイン固有語彙 各分野での利用に特化した語彙。 例)病床数、時刻表 など
共通語彙基盤の利用イメージ(統一フォーマット例) ドメインごとの情報を組み合わせ、一つの物事を表す。 公共施設情報 (○○医院) 施設:病院 名称 ○○医院 場所 住所 都道府県 東京都 市区町村 江東区 ... 経緯度座標 緯度 35.xxxxxxxx 経度 139.xxxxxxxx 地理識別子 識別子体系 □□住所コード 識別子 13103xxxxxx 連絡先 電話番号 03-xxxx-xxxx スケジュール 内容 診療受付時間 開始時間 09:00:00+09:00 終了時間 17:00:00+09:00 曜日 MON,TUE,THU,FRI アクセス 最寄り駅 交通:駅 △△駅 防災: 災害拠点病院 病床数 800 三次救急 True ヘリ離着陸 False コア語彙 (様々なドメインで共通で使用される語彙) 施設ドメイン (施設情報を表すために必要な事項) ドメイン 共通語彙 防災ドメイン (防災情報を表すために必要な事項)
共通語彙基盤(IMI)の検討状況 方針検討と整備検証を以下の体制で実施。 経済産業省・情報処理推進機構(IPA) IMIプロジェクト ・2012年度 事前調査 ・2013年度 基礎調査とプロト構築 ・2014年度 基盤整備と実利用での検証 コア語彙、ドメイン語彙の整備 ・2015年度 利用モデル普及とドメイン展開 外部調整 ・電子行政オープンデータ推進のため のロードマップ ・電子行政アクションプラン ・有識者会議 普及 ・情報交換パッケージの利用検証と 意見収集 情報処理推進機構 情報連携用語彙データベースPJ データベースの整備(コア語彙を管理、検索するデータベース) 「財務」「移動・交通」「地理空間・施設」「防災」のうち、他分野と関連する部分からサンプルを選び検討。セマンティックス、行政、国際語彙、標準の専門家による語彙の精査。 情報処理推進機構 情報連携用語彙データベース ツールPJ ツール開発、自治体と協力した実証 「制度」「道路」「イベント」「観光」のうち、自治体業務で実施している部分からサンプルを選び実証
共通語彙基盤の整備方針(トップダウン型) 政府内で共通的にルールを作るほうが望ましい語彙 住所、氏名、組織など、業務特性に依存しないもの 入力したいデータ 100-0013 東京都千代田区霞が関3-3-1尚友会館2階 株式会社田中商店 代表取締役 田中一郎 各種申請の入力様式 申請Aの記述様式 100-0013 千代田区 霞が関三丁目3-1 尚友会館2階 株式会社 田中商店 カブシキカイシャ タナカショウテン 田中 一郎 タナカ イチロウ 申請Bの記述様式 100-0013 千代田区 霞が関三丁目3-1尚友会館2階 チヨダクカスミガセキ 株式会社田中商店 タナカショウテン 代表取締役 田中 一郎 タナカ イチロウ 申請Cの記述様式 100-0013 東京都 千代田区 霞が関 3 3 1 尚友会館2階 株式会社田中商店 行政の申請においても、 基本的な語彙(住所、氏名等) の記載方法が異なる
共通語彙基盤の整備方針(ボトムアップ型) 現場の状況を整理しボトムアップで作り上げていく語彙 利用ニーズが高く、具体的な整理が各地で施行される領域 情報連携用語彙データベースプロジェクトやツールプロジェクトの中でユースケースをもとに整備していく。 都道府県と市町村の語彙が違っており、情報をマッシュアップできない
共通語彙基盤の整備方針(既存語彙連携型) 既存語彙や外部語彙との連携する語彙 府省、業界などで、国内、国際に通用している既存の語彙とは参照関係で連携する。 既に普及、または今後は普及が見込まれる、ドメイン専門部門等が整備した語彙 →積極的に活用。または、連携マップを整備。 ○既存語彙をそのまま活用 既存語彙(地図) ・・・ 博物館 病院 IMIの構造を使って、詳細情報を付加できる (この部分も既存の構造があれば活用) ドメイン語彙は、 既存の語彙に準拠等 ○複数語彙が並列している場合などは連携マップを整備 観光業界さん。IMIで定義する 「啓開」の情報を送ります 防災分野で使っている「啓開」は、「開通」のことですね 防災語彙 IMI 観光業界語彙 避難路 通行規制 啓開 避難所 ・・・ 避難路 通行規制 開通 ・・・ 通行止 開通 意味を明確化して連携
各種ツールの整備例①(「施設・サービス」分野 @横浜市金沢区) 保育所の空き 状況等の入力 データ入力 支援ツール 医療機関の診療状況、保育所の空き情報等を容易に把握 共通語彙DB 保育所型 イベント型① RDF 保育所型 保育所 臨時休診日等 の入力 HTML 医療機関型 施設情報提供 ポータルサイト (かなざわ育なび.net等) データ入力 支援ツール 公園型 RDF イベント型① 医療機関型 RDF HTML 住民 イベント型② 医療機関 イベント型② イベント型③ データ入力 支援ツール RDF 公園型 営業時間等 の入力 公園 管理者 イベント型③ 広域にわたる子育て情報 (保育所空き状況など) を提供 子育て情報提供サービス会社等 ・各種「施設・サービス」を記述するための基本データ型を提案。 ・データ入力支援ツールやDBの要件について考察。
各種ツールの整備例②(「イベントテンプレート」 @千葉県千葉市) 自治体 データ項目に関する属性等の メタ情報(場所情報・日時)を付与 人が見やすい表示 子育てイベント 情報等 イベント型の データ(HTML) イベント型のデータ (HTML+メタ情報) HTML 小児検診・ 予防接種など 子育てイベント 情報等 (一般的なサイト) 構造化データ 付与ツール メタ 情報 子育てイベント情報等 (場所情報、日時等のメタ情報を追加) 住民 イベントテンプレート 場所型 日時型 商品情報にメタ情報から 得たイベント情報を追加 子供向け商品情報 (子育てイベント情報等つき) 共通語彙DB 子供向け 商品メーカー等 ・各種「イベントテンプレート」を提案。 ・構造化データを付与するためのツールやDBの要件について考察。
共通語彙基盤は、既存のコードや語彙体系に置き換わるわけではなく、 今後の展開 2月1日から稼働している共通語彙DBの機能検証結果を整理。 ハッカソン等への情報提供(アプリ開発に特化した語彙)を通じた検証の実施。 今年8月までに共通語彙基盤の概念モデル(共通語彙基盤を支える語彙データベースや各種ツールの要求事項)の構築を行う。 関係政府機関、地方自治体間の情報交換シーンにおける共通語彙基盤導入が進むよう、普及啓発を実施。 負担軽減策としての各種変換ツール等を開発していく。 導入可能な自治体については保有情報を共通語彙基盤準拠に変換できるよう支援する。 共通語彙基盤は、既存のコードや語彙体系に置き換わるわけではなく、 情報交換規約として構築していく。
文字情報基盤
文字情報基盤の現状 平成9年「行政情報化推進基本計画(改定)」閣議決定 平成14年「汎用電子情報交換環境整備プログラム」開始 情報システムにおいて使用している外字について, JIS第3水準及び第4水準の制定を待ってその解消を図るとともに, この場合においても残る可能性のある外字について,交換のルールを策定する。 平成14年「汎用電子情報交換環境整備プログラム」開始 平成22年「文字情報基盤」開始(平成23年11月公開) 平成24年「世界最先端IT国家創造宣言」閣議決定 文字の標準化・共通化に関しては、今後整備する情報システムにおいては、国際標準に適合した文字情報基盤を活用することを原則とする。 平成24年「世界最先端IT国家創造宣言工程表」IT総合戦略本部決定 2013 年度中に文字情報基盤導入ガイドの作成を行い、2015 年度以降はアクションプランを踏まえ推進する。【内閣官房、経済産業省及び関係府省庁】 導入状況 累計ダウンロード数 5万件以上(他の民間ダウンロードサイト(窓の杜)の分を含まず) 札幌市、川口市等の先進自治体で導入。国や自治体の仕様への記載が増加中。 課題 ・一部ベンダが未対応
システムにどのように実装していくかが難しいため、ガイドを作成 文字情報基盤導入ガイドの概要 文字情報基盤:IPAmj明朝フォント(漢字58,814文字) 戸籍統一文字(漢字55,270文字) 住民基本台帳ネットワークシステム統一文字(漢字19,563文字) JIS漢字コード(10,050文字) 常用漢字(2,136文字) 法令、公用文書、新聞、雑誌、放送等、一般の社会生活において、現代の国語を書き表す場合の漢字使用の目安を示す。 実用上の情報交換の必要性から、出現頻度等を元に文字を選定(JISX2013:2004) 戸籍のオンライン手続に使用することを目的として整理した文字(辞書をベースに整理) 多くの住民が氏名に使う文字を整理 システムにどのように実装していくかが難しいため、ガイドを作成 関連ドキュメント 文字情報基盤導入ガイド ・導入パターンの提示 利用場面毎の上記文字の推奨モデル ・縮退変換マップの計画 文字情報基盤からJISへの縮退推奨モデル 文字情報基盤導入テクニカルスタディ ・プライベート領域を使った暫定処置 変体仮名案 技術参照モデル(TRM)[作成予定] ・仕様書記載案
導入ガイド内容例:適用業務と文字の範囲 導入ガイドでは、正確性と利便性をバランス良く導入するため、導入方法を提示。 (*A)必要に応じ、文字情報基盤で整備された文字図形以外の文字図形を、「外字」等として利用することが有り得るが、できる限り文字情報基盤の文字範囲に収まるよう、調整することが望ましい。 (*B)市場にある一般的情報機器の対応状況に応じ、変化する。 (*C)JIS X 0213範囲以外の文字については、図形イメージによる表示、伝送を検討する。 (*D)JIS X 0213範囲以外の文字については、表示を図形イメージによるものとするほか、Web上に漢字入力を支援するサービスを設けることを検討する。 (*) IVS(字形選択子)を使用するシステムでは文字情報基盤で整備した全ての文字(約6万文字図形)を区別可能。使用しないシステムでは約5万文字図形を区別可能。
国際標準化状況 文字情報基盤の全約6万文字のうち、5万6千字以上についてISO/IEC 10646規格化*が完了。 2013年度中に4,400文字を標準化、数年内には標準化は完了予定。 2015年度以降実装の文字を対象として、暫定導入のためのテクニカルスタディを提供。 2013年度 2014年度 2015年度以降 2013年12月 Unicode consortiumが登録を受理し、パブコメ中 (~2014年3月) 現在IVD登録後にIVS実装 6,800 ISO/IEC 10646 第3版(2012年版)の発行を受けたフォント実装 6,100 ISO/IEC 10646 第4版(2014年発行予定)を受けたフォント実装 約3700文字 符号化未了文字数 IVD: Ideographic Variation Database IVS: Ideographic Variation Selector UCS: Universal Multiple-Octet Coded Character Set 2,400 約500文字 1,900 ISO/IEC 10646 規格化完了! 約1900文字 2012年10月、ISO/IEC JTC1/SC2/WG2/IRG へ提案し、受理済み(現在審議中) 2013年11月 IPAmj明朝ver.002.02公開 2014年夏(予定) IPAmj明朝バージョンアップ ※ 国際符号化文字集合(ユニコード)の国際規格
文字情報基盤全体像と今後の方針 文字、ガイド、支援ツールにより、府省や自治体の導入を総合的に支援していく。 文字 ガイド 支援 ツール IPAmj明朝 フォント 文字情報一覧 拡大縮小が自由にできるOpentypeフォーマット 文字の画像ファイルも併せて提供 各種文字コード間の関係や部首などの文字の基本情報を一覧で整理 変体仮名 フォント 一覧 変体仮名のフォントを提供し、文字情報基盤の運用を補助 ガイド 文字情報基盤導入ガイド 業務によって使うべき文字範囲の例示など基本的方針 文字情報基盤導入 テクニカルスタディ 符号化完了までの暫定運用推奨案 支援 ツール 文字縮退変換マップ(H26予定) 文字情報基盤からJIS第4水準までの縮退対応表 導入事例 札幌市等での文字情報基盤導入実証の結果を整理 調達仕様書記載例(H26予定) 調達仕様書への記載例を提示 文字データベース 文字をだれでも使いやすくするデータベース 普及セミナー 普及