リスクコミュニケーションのための情報共有支援システム 静岡大学工学研究科システム工学専攻 前田研究室2年 5063-0311 松田和道 2017/3/18
背景と目的 「eコミュニティしまだ」での情報共有を 支援する情報システムの構築 静岡県島田市 「eコミュニティしまだ」 情報共有が必要 東海地震 地域リスクに対するリスクマネジメント・リスクガバナンス リスクコミュニケーションが不可欠 リスクマネジメントの調査・分析 リスクコミュニケーション・情報共有の必要性 「eコミュニティしまだ」 地域の人々の活動を支援(blogで情報発信) 情報を共有することで地域の人々を結びつける リスクコミュニケーションを行うことができる関係作り 「eコミュニティしまだ」での情報共有を 支援する情報システムの構築 情報共有が必要
研究方法 eコミュニティしまだの現状分析 情報共有支援システムの設計 情報共有支援システムの構築
eコミュニティしまだの現状分析 現在の情報共有支援 問題 記事間の関係、コミュニティ間の関係を可視化 共有ポータル:各コミュニティのHPへの共通の入口 WebGISの共有:各コミュニティが投稿した地図情報を1つの地図に集約 管理人ぶろぐ:関連する記事の紹介 イベント:交流の機会を与える eコミカフェ:交流拠点 問題 記事の独立 同じ話題について書かれた記事があるが、その記事を書いた人の間でコミュニケーションがない コミュニティ間の連携の不足 Web上の関係だけでない顔の見える信頼できる関係への発展の不足 記事間の関係、コミュニティ間の関係を可視化 記事・コミュニティを結びつけ、情報共有
コミュニティ間の情報のやり取りの促進、連携 可視化による情報共有支援 記事間の関係、コミュニティ間の関係を可視化 気になる記事や気になるキーワードから類似する記事を可視化 自分の記事に類似する記事、興味のある記事に類似する記事の発見 コミュニティの活動内容や興味のある話題の発見 活動内容や興味に共通点を持ったコミュニティの発見 文書間の関連を視覚的に表示 情報共有支援システム 気になる記事 関連記事 トラックバック 類似 … 蓄積された大量の記事 気になるキーワード eコミュニティしまだ コミュニティ間の情報のやり取りの促進、連携 自分の記事に興味を持って くれているコミュニティの発見 図1:情報共有支援のイメージ
情報共有支援システム 検索機能 単語→記事連想検索 記事→記事連想検索 (テキスト入力フォームから) (TouchGraphから) 図3:情報共有支援システムのUI クライアント Webブラウザ サーバ eコミュニティしまだ “入力” 記事、キーワード “GETA” 類似する記事の計算 “TouchGraph” 記事グラフの生成 “表示” 記事グラフ 記事の詳細情報 記事 HTTPリクエスト RSS CGI 記事情報 計算結果 情報共有支援システム “XOOPS” blogモジュール “WordPress” 1回/日 図2:情報共有支援システムの概要
TouchGraph グラフィックベースでデータを表示するオープンソースのJavaプログラム 構成 特徴 Java applet Webブラウザで表示可能 構成 ノード(文字列を表示) ノード間を繋ぐ枝 特徴 グラフに対してユーザが操作可能 ノードの移動、グラフの移動・拡大・縮小・回転が可能 図4:TouchGraphの表示例 http://dss.sys.eng.shizuoka.ac.jp/rsdss/
汎用連想計算エンジンGETA 大規模かつ疎な行列を扱う、サーバ側で動作する計算エンジン(C言語ライブラリ) ネットワークを通じて複数のPCから作業可能 Perlモジュール CGIを用いて計算結果を動的に Webページへ反映 WAM(Word-Article Matrix) 行や列に固有の属性を付加 行:文書 列:単語 文書間の類似性(近接度)の計算 図5:WAMのデータ構造
汎用連想計算エンジンGETA Singhalの方法 単語と文書の間の類似度の計算 文書(記事)→単語連想検索 単語→文書(記事)連想検索 対象データ文書集合D の中の選択された 文書集合Sにおける 各語tの類似度w(t|S) 単語→文書(記事)連想検索 単語の数をn個とし、 それらの単語を t1,…,tnとしたとき、 文書bの類似度s(b|{ti})
eコミュニティしまだのデータ構造 メインシステム blog機能 RSSフィードから記事データを取得 XOOPS オープンソースのCMS(コンテンツマネジメントシステム) blog機能 blogモジュール「WordPress」 記事情報をRSSフィード(RSSで記述された文書)として公開 RSS:Webサイトの見出しや要約などのメタデータ(データについての情報を記述したデータ)を構造化して記述するフォーマット 記事に関するほぼ全ての情報が入手可能 コミュニティごとに最新の記事10件分の情報しか取得できない 古い記事データ:htmlファイルから取得 RSSフィードから記事データを取得
システムのUI ノード 枝 記事タイトルを表示 コミュニティ名と作成年月日をポップアップ表示 ダブルクリックで記事本文を開く GETAが計算した類似度の高い最大30件の記事 枝 トラックバック(赤色) 類似関係(近接度で分類) 強(緑色):平均値以上 中(水色):{(平均値+最小値)÷2}以上、平均値以下 弱(灰色):{(平均値+最小値)÷2}以下 近接度 文書XとYが含んでいる単語のうち共通部分(ともに含む単語)の割合 全てのノードが連結するまで生成される Pxy:文書xと文書yの近接度 Fxy:文書xおよび文書yが共に含んでいる単語の数 Fx:文書xが含む単語の数 Fy:文書yが含む単語の数
評価 キーワード「地震」で検索 左側の塊は 図6:キーワード「地震」で検索した結果 「しまだ環境ひろば ごみ分科会」の記事 評価 キーワード「地震」で検索 左側の塊は 「しまだ環境ひろば ごみ分科会」の記事 防災対策にも風呂敷が利用できる しかし… コメントもトラックバックもない たくさんの記事に埋もれてしまう可能性のあった記事を発見 防災にも関心 地震の影響があった、あるいは影響がありそうな場所についての記事の集合 2つのコミュニティで異なる時期(2005年12月~2006年5月)に散発的に投稿されたもの 複数のコミュニティが共通の話題で繋がり、時期の異なる記事にも繋がりがある 図6:キーワード「地震」で検索した結果
結果および考察 評価によって得られた本システムの特徴 記事の繋がり、コミュニティの繋がりを可視化できる eコミュニティしまだで活動している人々、コミュニティを結びつけることを可能にする情報共有支援の重要な要素の達成 複数のコミュニティの記事、時期の異なる記事を1つのグラフに表示できる 意外な記事、意外なコミュニティとの繋がりの発見 埋もれてしまいそうな記事のピックアップ 様々なコミュニティへの関心を高める可能性 入力したキーワードに関連する記事だけでなく、入力したキーワードに関連するキーワードに関連する記事も発見できる 関連のある幅広い記事の提供 新しい繋がりの発見、興味を生み出す助けになる可能性
結論 eコミュニティしまだで活動している人々、コミュニティを結びつけることを可能にする情報共有支援 今後に期待 RSSの利用 可能である可能性を示せた 今後に期待 人々に繋がり、コミュニティに連携 RSSの利用 サーバに与えるデータベースの更新作業の負荷を削減 汎用性を高めた <課題> 自由な検索 枝の視認性の改善 記事間の類似関係の詳しい把握 リスクコミュニケーションの支援 検索条件の設定 指定した種類の枝の表示・非表示 共有しているキーワードの表示
ご清聴ありがとうございました
eコミュニティしまだ ICTを用いて地域の様々な活動を支援 防災訓練 ハザードマップ作成 市民・コミュニティを結びつけ、 blog WebGIS ICTを用いて地域の様々な活動を支援 Blog WebGIS 防災訓練 ハザードマップ作成 利用 市民・コミュニティを結びつけ、 リスクコミュニケーションを支援 図1:eコミュニティしまだで書かれた記事 http://www.community-platform.jp/
共有ポータル 市民の活動を結びつけるために、共通の入り口である「共有ポータル」と呼ばれるホームページが用意されている 最新の投稿記事 参加グループ一覧 最新の投稿記事 図:eコミュニティしまだ(共有ポータル) http://www.community-platform.jp/
ハザードマップ 住民たちが現地踏査などを基にワークショップで話し合い、作成したハザードマップを電子化したもの 図:eコミュニティしまだ(ハザードマップ) http://www.community-platform.jp/
事例 ~コミュニティ間の連携~
eコミュニティしまだ 活動グループ数 7グループ(開始当時:2004年12月) 23グループ、合計人数126人(2006年2月) 40グループ、合計人数126人(2007年12月) 表:アクセス数(抜粋)
近接度 ノード間をつなぐ枝の生成 文書間の類似関係を表す類似性尺度の検討が必要 共起度 異なる2つの単語が同じ 文書に出現する数 逆 w1 w2 w3 w4 w5 w6 … 文書 d1 3 1 d2 d3 2 4 d4 d5 5 d6 7 : 共起度 異なる2つの単語が同じ 文書に出現する数 逆 文書間の類似度 異なる2つの文書に出てくる 同じ単語の種数 図:WAMにおける共起度と文書間の類似度
WAMの構造 WAMは行列形式でできており、行に文書、列に単語が割り当てられ、行列の要素は、文書内の単語の出現回数が保存されている 各行および列には通し番号(ID)が割り振られており、それぞれのIDは対応する固有の名前(name)を持っている WAMはCWとXRからなる CW: IDとnameの対応表 XR: 文書内の単語の出現回数を管理するファイル XRでは、ゼロである要素は省略して管理される 疎な行列の場合、ゼロである要素が多いため、データ量が少なくて済む WAMの構造は大規模かつ疎な行列を扱うのに適している GETAは大規模かつ疎な行列に対して高速な計算ができる
eコミュニティしまだの 関係者からの意見 eコミュニティしまだに必要なシステム しかし、今までこれをやる人材も時間もなかった 情報共有支援の1つになると考えられる eコミュニティしまだで、記事の紹介などを行っている“編集者”にとってとても助かるシステムである 昔の記事などを思い出して書くのも大変 強い自明な繋がりよりも、編集者も気付かない弱い繋がりが見えると嬉しい 編集者それぞれ違った検索結果になると、面白い
可視化による情報共有支援 可視化方法の調査、検討 情報共有支援に必要なユーザインターフェースの要素の整理 表1:情報共有支援に必要なユーザインターフェースの要素