Presentation is loading. Please wait.

Presentation is loading. Please wait.

ビッグデータとオープンデータ 情報社会とコンピュータ 第12回.

Similar presentations


Presentation on theme: "ビッグデータとオープンデータ 情報社会とコンピュータ 第12回."— Presentation transcript:

1 ビッグデータとオープンデータ 情報社会とコンピュータ 第12回

2 情 報 爆 発(1) 今,大量の“情報”が生成されている 2013年に地球上で生成された情報は 4兆4000億GB と推測 ↓
   ↓ 2020年には,44兆GB と予想 と言われても… 2013年に地球上で生成されたデータは4.4ZB、ほとんどがダークマター 急増するセンサーにより、デジタル ユニバースが拡大

3 情 報 爆 発(2) YouTubeに1分間でアップロードされる動画 2007年 6時間分 2008年 13時間分
2007年 6時間分 2008年 13時間分 2013年 100時間分以上 YouTube開設から8年、現在は1分間に4日分以上の動画がアップロードされる

4 情 報 爆 発(3) 背景 SNSとかいろいろあるが… 人間だけが情報を生成しているわけではない “モノ”が生成している センサー

5 情 報 爆 発(4) “モノ(センサー)”がインターネットに接続され,情報を送り出す モノのインターネット
IoT Internet Of Things インターネットには情報があふれている ヒト+モノ

6 情 報 爆 発(5) あふれる情報 ほとんどが活用されていないのが現状 ダークマター(暗黒物質) 膨大な情報をどう使うのか?

7 ビ ッ グ デ ー タ

8 ビッグデータとは(1) 大量のデータ “ヒト”が生成 文字,画像, …                      多様なデータ “モノ”が生成 センサー(位置情報,温度,…)

9 ビッグデータとは(2) 特徴 大量のデータ(Volumue) 多様なデータ(Variety) 発生速度が速い(Velocity)
もちろん,すべての特徴を有するものだけではない

10 ビッグデータとは(3) 大量のデータをすべて処理する能力(コンピュータのパワー)がなかった 一部だけを取り出して処理 サンプリング
処理に時間がかかる 月末にまとめて処理(バッチ処理) データが生成されてから,使われるまでに時間がかかる

11 ビッグデータとは(4) 強力なコンピュータ 大量のデータを全件処理可能 迅速に処理可能 発生した情報を直ぐに処理し,その結果を活用できる
データが“新鮮”な うちに,活用できる

12 ビッグデータとは(5) 従来の手法(特にデータベース)では,多様なデータは扱えない 新しい技術・手法

13 ビッグデータとは(6) ビッグデータだから,“見えてくること” 少ないデータからでは,分からないこと 従来は処理できないデータ
あっても,“存在しない”データ 新たなビジネス

14 ビッグデータ活用事例

15 Google インタネットの検索 インターネット上の大量の情報を処理 典型的な事例

16 次世代自動販売機・JR東(1) なぜ,“次世代”なのか

17 次世代自動販売機・JR東(2)

18 次世代自動販売機・JR東(3)

19 次世代自動販売機・JR東(4) いろいろな情報 周辺の情報 天候,時間帯 購買客の情報 年代,性別 ちなみに,この自販機は高崎駅にある
おすすめ商品

20 カーナビデータによる 道路危険箇所の解消(1)
埼玉県庁 通信機能のあるカーナビからの情報 急ブレーキが多い場所が分かる

21 カーナビデータによる 道路危険箇所の解消(2)
このような対策で,人身事故が2割減

22 位置情報は個人情報?(2) 第7回 モバイル空間統計(NTTドコモ) いつ,どこに何人いるか 災害時の帰宅困難者数の予想など “一人ひとりを示すデータではなく、集団の人数のみをあらわす安全な人口統計情報に加工したもの” 非識別化・集計・秘匿の各処理

23 D N A(1) 第7回 遺伝子情報 究極の個人情報と言われる 漏えいなどがあっても変更できない

24 デ ー タ の 収 集

25 どうやってデータを集めるの(1) 既に持っている その活用 問題はデータがコンピュータで処理できる形か? 紙に印刷してある,だと…

26 どうやってデータを集めるの(2) 自分(自社)で集める 意識させずに集める 検索のキーワード Google Trends より的確な結果
ポイントカードなど 顧客の属性と購入した商品を結び付ける

27 どうやってデータを集めるの(3) 買う(売る) 日本でのデータ再販について
日本でのTwitterデータの再販のパートナーであるNTTデータさんとの関係は、これまで通り戦略的パートナーであることに変わりはありません。

28 どうやってデータを集めるの(4) オープンデータ 自由に使うことのできるデータ 特に,行政機関の保有するデータが注目されている
オープンデータ戦略の推進(総務省) コンピュータで処理できる形で公開しないと意味がない

29 オ ー プ ン デ ー タ

30 前 橋 市(1) 前橋市オープンデータライブラリー

31 前 橋 市(2)

32 前 橋 市(3)

33 オープンデータの活用(1) 公開されたデータをどのように使うのか? 施設の位置情報 + 地図データや交通機関の情報 ↓
    + 地図データや交通機関の情報     ↓ 今いる場所から,どのように行くのか(道案内)

34 オープンデータの活用(2) というようなアプリを作る 誰が? 誰でも良い 新しいビジネスが誕生すれば,地域活性化 “材料”はタダ
それをどのように“料理”するのか!

35 ビッグデータやオープンデータの問題

36 “Suica事件” Suicaに関するデータの社外への提供について(2014/3/20) Suicaの利用状況の情報を売ろうとしたが,批判が多く中止した 個人を識別できないようにしてから売ろうとしたが,詳細不明な点が多かった

37 位置情報は個人情報?(2) 第7回 モバイル空間統計(NTTドコモ) いつ,どこに何人いるか 災害時の帰宅困難者数の予想など “一人ひとりを示すデータではなく、集団の人数のみをあらわす安全な人口統計情報に加工したもの” 非識別化・集計・秘匿の各処理

38 個 人 情 報 の 取 扱 い(1) SuicaもNTTドコモもデータを匿名化 Suicaは,データを社外に提供
結果を公表

39 個 人 情 報 の 取 扱 い(2) 他の(いくつかの)情報と照合すると,識別できるようになる可能性
これが“ビッグデータの活用”かも知れない 匿名化されたデータでも,自社の手元から離れたら,その先でどう扱われるのか? 行政機関の情報には特に注意が必要

40 ビッグデータはすべてか?(1) 今回紹介した“カーナビデータ” ある特定の会社のカーナビ
別の会社のカーナビを使っている自動車は急ブレーキをかけていないかも知れない?!

41 ビッグデータはすべてか?(2) Google Flu Trends(インフルトレンド)
検索キーワードからインフルエンザの流行を予測できる(2009年頃) その後,あまり精度が良くないことが判明した ビッグデータは嘘でも万能でもない--グーグルの「インフルトレンド」論議から考える(2014/5/21) 「Googleインフルトレンド」の失敗から学ぶ、ビッグデータの未来(2014/4/30)

42 ビッグデータはすべてか?(3) ビッグデータは大量のデータである しかし,すべてのデータではない どのようなデータが抜けているのか?
Googleの検索を使わない人のデータは? 偏りのあるデータ

43 ビッグデータはすべてか?(4) データの“質”は? 信頼性を欠くものが混ざっている可能性は?
“大量”ということで,“偏り”,“信頼性”の問題を克服できた,と思った,が…

44 ま と め

45 ビッグデータ(時代) 大量・多様なデータ 今までもあったのではないだろうか? すべてを迅速に処理し,活用できる ディジタル化
コンピュータで処理する前提条件 コンピュータの処理能力の向上 クラウドコンピューティング

46 反 省 ビッグデータは万能ではない プライバシーの点 完全なデータではない点 どのように乗り越えるか?

47 “ビッグ”でなくてもいいじゃないか 前橋市提供のオープンデータは“ビッグ”か?

48 データは資源 活用することによるメリット いろいろな問題をどう克服するか

49


Download ppt "ビッグデータとオープンデータ 情報社会とコンピュータ 第12回."

Similar presentations


Ads by Google