資料3 経済産業省での オープンデータの取り組み 平成24年10月 商務情報政策局
Overview オープンデータは本格導入への第二ステージへ 2008年3月 英国Power of Informationタスクフォースを開始 2008年10月 行政CIOフォーラム(経済産業省)で検討を開始(行政情報のオープン化は主要課題) 2009年3月 米国Data.govを開設 2009年3月 「電子行政一点突破プロジェクト」 (経済産業省)を発表(行政情報のオープン化、バリューチェーンを提言) 2009年10月 オープンガバメントプロジェクト(経済産業省)の第一弾としてアイディアボックスを開始。 集まった意見をオープンデータ化 → 「アイディアボックスその後」サイトができる 2010年7月 オープンガバメントラボ(経済産業省)を開設 2010年9月 データボックス(経済産業省)を設置。検証を実施。 統計データをオープンデータ化、BIや意見収集の検証 2011年3月 調査報告書(著作権などの課題の整理等) 2011年7月 節電.go.jp の開始 電力需給データ公開(API含む)→ 各種ガジェットやデジタルサイネージが活躍 2011年10月 文字情報基盤の公開 文字データの公開 → 半年で約20000件のダウンロード 2011年10月 ツタグラの公開(Infographicsサイト) 2012年1月 復旧・復興支援制度データベースの公開 復旧・復興支援制度の公開(API含む)→ NPOサイトや冊子が作成される 2012年3月 調査報告書(マーケット規模調査等) 2012年6月 IT融合フォーラム(経済産業省)を開始 2012年7月 電子行政オープンデータ戦略( IT戦略本部)を決定 2012年7月 Data METI構想を公表(経済産業省) 各府省に先行して導入事例を整備し、オープンデータ普及の呼び水に オープンデータは本格導入への第二ステージへ
調査研究や勉強会からの示唆 データ公開からの示唆 アイディアボックス 統計データ 各種資料の公開 節電データベース 文字情報基盤 ツタグラ 復旧・復興データベース データマッシュアップ等からの示唆 情報産業人材データ 報告書一覧 CIO補佐官調達・落札情報 データ運営からの示唆 教育コンテンツ 利用サイドとの交流からの示唆 コンテスト等の呼びかけ ハッカソン
これまでの勉強会等での論点と課題等 ニーズについて ニーズをベースに公開するデータを考えていく必要がある。何かありそうだという議論はあるが、具体的なものが出てこない。 公開することでニーズは生まれてくるという楽観的な考え方で、やみくもにデータを出すのではコストばかりかかる。 データ主体について(データホルダ自体の課題) 多くの場合、地方自治体が情報を持っている 行政機関自身がデータの存在に気がつかず、死蔵されている場合が多い。 地方公共団体コードなど、行政機関の人には当たり前だが、一般の人は知らない情報がある。 同じデータでも、地方局や自治体によってデータを公開しているところと公開していないところがある。 データ主体について(データの公開方法についての課題) 公表資料はPDFが多い。 機械判読可能な形式で公開することが重要である。 多くのデータがどこにあるのか分からない。 行政でどのような情報を持っているのか、データカタログが必要である。 データがどこにあるのか問い合わせサービスが必要である。 データの正確性とデータの速報性はトレードオフである。場合により検討が必要である。 APIを出しているシステムはほとんどない。 API等は、提供側だけの議論では分からないこともあり、提供側と利用側の意見交換のメカニズムが必要である データ主体について(データの形式等についての課題) データ形式・構造の標準化が必要である。このままでは、マッシュアップできない。 情報の意味レベルでの用語定義も必要である。
これまでの勉強会等での論点と課題等 マーケットやニーズの創出について 欧米では、ここをマーケットとして考えており、確かにその片鱗は見えつつある。 コンテストは有効と考えられる。 ポリシーについて データを海外にまで開放するかという議論はあるが、現実的にはそこを管理することはできない 利用規約がデータ毎にバラバラであり、一番厳しい規約に合わせないとマッシュアップできない 非営利目的なら出してよいのか、営利目的は駄目なのかという検討も必要である。 原票まで見せて欲しいという意見がある一方で、匿名性をどう担保するかの問題がある。 統計のローデータでも、特定地域の大企業と検索することで、企業が特定される場合があり、匿名性の担保が重要である。 国の報告書等は、米国のように著作権を持たせないようにすることも必要ではないか。 温度などの生データには著作権がないがデータベースになると著作権が発生する、データの活用方法も含め議論が必要である。 財政法で、データの活用に適正な対価を取ることが求められている。 各府省のホームページの規約もばらばらである。統一が望まれる。
調査研究や勉強会からの示唆 データ公開からの示唆 アイディアボックス 統計データ 各種資料の公開 電力データ公開 文字情報基盤 ツタグラ 復旧・復興データベース データマッシュアップ等からの示唆 情報産業人材データ 報告書一覧 CIO補佐官調達・落札情報 データ運営からの示唆 教育コンテンツ 利用サイドとの交流からの示唆 コンテスト等の呼びかけ ハッカソン
アイディアボックス 国民の声を集める仕組みとして経済産業省が開発・運用。 経済産業省 ・電子政府 ・情報政策 国民の声 休日分散化 就活 国民同士の対話 国民と職員との対話
アイディアボックス
アイディアボックスのオープンデータ化とその示唆 議論のデータをオープンデータ化。 ピックアップして恣意的に情報を活用しているという疑念の払拭 アイディアボックス自体の取組みを含め、オープンデータは政府の信頼度、好感度向上に寄与 データ出力が困難なクラウドサービスを利用したため、公開前のデータクレンジングが負荷 オープン化したことでアイディアボックスを再現したサイトが公開された
統計データ(データボックス) 行政統計データをインターネット上で公表し、検索機能によって所望の統計情報獲得を容易にするサービス。 統計情報を公表するだけではなく、統計情報の利活用促進のための以下のような機能を提供。 容易にグラフ化できる機能(データグラフ化機能)、 都道府県グラフ機能 ユーザーに自由に表頭・表側の選択やドリルダウン/ドロップダウンを実現できる機能 (パターンオーダー型データ提供) 提供された統計情報に関するレイティング機能やコメント付与機能(国民との双方向性実現機能) SDMX(統計用XMLデータ)など提供ファイル形式の多様化 OpenIDを活用したユーザー認証・アクセス制御機能
データボックスによるオープンデータ化とその示唆 ニーズをベースに公開する情報を選択しないと、情報公開経費の割に使われない 公開したものの使われないデータが多かった。(一方で、様々な活用方法があるので、ある程度のブロックで公開する必要がある) データへのコメント機能は、データへの解釈をするうえで新たな視点を示せたが、継続的に行うためには管理の仕組みが必要。(国のサイト自体でやるのかAPIを介して外部でやるのか検討が必要)
各種書類やデータの公開とその示唆 誰もが情報にアクセスし、活用できるように、情報公開組織に改善の呼びかけ。 情報の2次的な利用、ネットワークの負荷軽減、携帯電話等からのアクセスなど考慮 PDFやWord、Excel等の形式ではなく、CSV、html等とすることを推奨 経済産業省では、Twitter等で、再利用可能なデータの提供を、以前から広く呼びかけていた 公式な呼びかけを実施 自治体への呼びかけ 国民へ発信する重要情報のファイル形式について (3/18 LASDECより全国地方公共団体へ通知) 府省への呼びかけ 震災関連情報の提供に係る協力依頼 (3/22 内閣広報官より各府省へ通知) 企業への呼びかけ 東北地方太平洋沖地震等に係る情報発信のデータ形式について (3/30 経済産業省より社団法人日本経済団体連合会へ通知) データ容量削減や配布の簡易さから、問題意識なくPDFで情報公開している場合が多い 公開されたデータの改ざん防止からPDFで公開する場合も多い(正しい情報を信頼できる情報源から出し続けることが重要)
電力データの公開とその示唆 電力需給・予測データを公開することで、様々なアプリケーション開発を誘発。 ガジェット スマートフォンアプリ デジタルサイネージ 価値のあるデータを公開すると、多様なアプリケーションが開発される。 「データを公開するとデータが変更され問題が起こる可能性がある」という心配への対応が必要 API変更にはアプリの変更も必要なため、予告期間と移行期間が必要である 仕様書にAPIを作るという記述だけでは、技術力と構想力のない企業が受託するとAPIを作ることが単にコストになるだけで効果を生みださない
ツタグラ(Infographics ) 単に情報を公開するだけではなく、わかりやすく情報を伝えていくことも必要。そのためにインフォグラフィックスという手法の活用を推進。 データ活用のイメージのない人向けや、データをより効果的に伝えるために、単なるグラフ化ではない見せる工夫が必要。
文字情報基盤のオープンデータ化とその示唆 戸籍や住民票で使う文字と互換性のあるフォントと文字情報を無償で公開。 行政機関だけではなく、民間も利用可能なように公開 住民基本台帳ネットワーク 統一文字(21039字) 常用漢字 (2136字) JIS漢字コード (10050字) 戸籍統一文字(56040字) ・・・ オープンデータにするだけでなく、活用事例、ルール事例を示すなど、利用促進をすることが重要 データオープン化により民間サービスに影響が出る場合には、関係者との事前の調整が必要
復旧・復興支援制度データベース 窓口相談 標準フォーマット web API 500件を超える支援制度 国や自治体の被災地支援制度をワンストップで簡単に検索 コンセプト:「被災地に支援制度の情報を適確に届けたい」 窓口相談 フリーダイヤルとも連携 行政機関職員、行政書士等の 行政業務の専門家による相談 府省 標準フォーマット web 制度 利用者 API 自治体 東北教育支援ネットワーク 官民の各種情報が検索できます 奨学金検索 教材検索 学校検索 500件を超える支援制度 外部によるサービス (企業、NPO、個人 他)
復旧・復興支援制度データベースからの示唆 各府省・自治体がばらばらに情報提供を行っていた震災復旧・復興支援制度の情報のデータフォーマットを標準化。機械処理が容易な形式で提供。 「融資」「貸与」「貸付」等の類似語を融資のタグで管理 各府省・自治体から支援制度情報を収集する際に、データの2次利用を認める扱いとすることを明示的に確認。 単にオープン化するだけではなく中身のコンテンツをわかりやすくすることが重要 データ項目の標準化が必要 「融資」等の記述内容は制度等で規定されている場合があり、単純に統一できないので、タグのような集約の仕組みが必要 サービスやAPIを継続することを保証しないと、二次利用は進まない データフォーマットを標準化 2次利用可能であることをサイトで明示