第3回 ビッグデータ「予想ビジネス」 ビッグデータを構成する例 『平成24年版情報通信白書』
1.ビッグデータとは 日本IBMが提唱する3つのV+新たなV ・ 多様性 (Variety):様々な構造化データに加え、音声、画像・映像、テキスト、ク リックストリーム(閲覧者の行動)など様々な非構造データが存在す る。 ・ 頻度 (Velocity):防犯カメラやセンサー(バーコードやICタグ)などから絶え間なく 情報が発信され、SNS上では頻繁に情報の受発信が行われている。 ・ 大量 (Volume):企業が収集・分析するデータが膨大になり、ペタバイト(PB)の 処理能力が当たり前に求められる時代。 1, 000, 000, 000,000,000,000,000 ZB EB PB TB GB MB KB (ゼタ)(エクサ)(ペタ)(テラ)(ギガ) (メガ) (キロ) + ・ 正確さ (Veracity):正しい意思決定には信頼性の高い情報が不可欠ということ が再認識された。データの矛盾の発見、曖昧さの排除、近似値の 積み重ねの禁止などを重視しなければならない。
(顧客情報、販売データ、名簿、学籍番号、成績表など) (ネット検索・書き込み、気象状況、位置情報、カメラ画像・映像など) データ収集から活用まで ※この世の中にデータは溢れている。多様なデータを 収集 し、 分析 することが最初のステップである。 ※次に、データを情報や知識に 変換 し、ビジネスへの活用を検討する。 ※ 活用 するには既存の仕組みを変えなければ機能しないことがある。 データ 構造化データ (顧客情報、販売データ、名簿、学籍番号、成績表など) 非構造化データ (ネット検索・書き込み、気象状況、位置情報、カメラ画像・映像など) 収集(ネット経由増) 分析(情報や知識に変換) ビジネス(社会)で活用 販売促進 (戦略立案) 新製品開発(事業創造) リスク回避 (予測) ※構造化データは表形式に整理されたデータのことで、情報システムでの処理に適している。 ※この世の中は、非構造化データの方が多い。 ※非構造化データを収集し、構造化した後の扱いが重要となっている。
非構造化データの活用事例 顧客からの苦情 SNS上の不満 来店客の行動 収集方法 電話(コールセンター)、葉書き投函、メール投稿、ホームページへの書き込みなど。 TwitterやFacebookでつぶやかれた内容を収集 センサー内臓カメラ 音や光など特定の事象を感知する装置または部品。感知した結果は電流のオンオフや電圧、デジタル情報に変換して出力する。 構造化 電話やハガキは入力が必要。テキストマイニングなどの技術を用いて分析。 不満や希望などの情報を整理・蓄積 動線(時間と場所) 行動(選択方法と時間) 活用事例 ・新製品の開発 ・サービス水準向上 ・戦略立案・転換 ・新製品開発 陳列やレイアウト変更 セット割提案 課題 「コールセンターは宝の山」。書き込みやメールをそのまま自動で読み込む。 コールセンター以上の宝の山として注目。 費用やプライバシーの問題などがある。
2.ビッグデータ出現の背景 パソコンやモバイル機の普及と性能向上 ・CPUの計算速度が10年で100倍に(3GHz出現、2005年で は30GHz) ・「 知を持ったIT 」の出現:リアルタイムのデータを自動で 処理し、意思決定支援 ・スマホやタブレットの性能がPC並みに進歩 通信速度 の向上 ・固定機器の通信速度が10年で1600倍に(100kbps:1秒間 に100キロバイト) ・モバイル機器の通信速度も上昇 ※ネットワークが整備され、高速で大量の情報が提供で きる環境が整った センサー の普及:様々なデータを自動的に取り込めるよう になった。センサーが至る所に設置され、 データを生み出すようになった。例えば、 バーコードや生体認証用の端末など。 速度 PCの通 信速度 モバイル機器の通信速度 年 ネットワーク上の 情報量 データ 爆発 年
センサー技術の活用例 GPS(Global Positioning System: 全地球測位システム ) ・衛星を用いて、地球上の人や車などの現在地を測定 スマートメーター ・通信機能を持ったデジタル 計測 器(電気、ガス、水道等) スキャナー ・バーコード、文字、画像などを読み込む(レジ、マークシート、生体認証など) RFID タグ ・通信機能を有するタグによって、現在地を把握(品物やコンテナなどに活用) 冷蔵庫の場合(スマート家電の一例) ・扉の開閉回数と長さ(時間) ・冷蔵庫内外の温度 ・冷蔵庫の中身(個数と保存期間) ※エコ運転と買い物(注文)支援
データ爆発の原因 1.インターネットに接続する 端末 の増加 ・PC、スマホ、タブレットに加え、テレビやゲーム機などの家電も急増(IoT) 2.ソーシャルメディア 普及 (利用者は50億人超とも言われている) ・SNSなどの利用が移動中でもスマホから可能(頻度も多い) ・FacebookやInstagramなどでは写真や動画投稿(情報量大) ・企業もマスメディアだけでなく、ソーシャルメディア活用に本腰 3.クラウドコンピューティングの進展 ・データの保存を ネット 上で行うことが進み、通信量は急増。 4. センサー からの情報急増 ・バーコード、文字、画像など以外にも、気象情報や災害情報の把握のため にデータを生み出し続けている。省力化・迅速化・効率化のためにも、セン サーの活用用途が急拡大している。 5.膨大な仕事を複数のコンピュータで 分散処理 することの進展 ・遊休資源の有効活用はできるが、通信量は増加する。
カード利用を分析しやすく 経産省、購買データに規格 小売店への提供後押し 『日経新聞』 2016/2/24 カード利用を分析しやすく 経産省、購買データに規格 小売店への提供後押し 『日経新聞』 2016/2/24 経済産業省は消費者がクレジットカードで買い物し た際のデータ規格を 共通化 し、小売店などが情 報を活用しやすくする。今後は小売店がデータを基 に新規出店や商品企画などの戦略を立てられるよ うになる。 大手小売店などの場合、 POS データを使えば消 費者が何をどれだけ買ったのか把握できる。一方で 消費者の年齢や性別、他の店での購買状況などは 分からない。より詳しいクレジットカードのデータを 「ビッグデータ」として 消費動向 が分析できる。 データを活用する仕組みができれば、量販店などは 自社の店舗でのカード利用実績などをカード会社か ら取り寄せて分析できるようになる。中小の小売店 などは外部の会社が分析した内容を活用する。