リスク情報サイト横断検索システム 静岡大学システム工学科 前田研究室 高柳真吾
研究背景 地震災害 ・静岡県を中心とした地震防災対策強化地域では 東海地震による深刻な被害が予想される。 自助・共助・公助 ・防災対策には行政による「公助」、自分の身を 自分で守る「自助」、地域や身近な人で助け合 う「共助」の連携が必須である。
研究背景と目的 ② ・情報共有による自助・共助・公助の連携 事前に公助による防災情報を知っておくことで災害時に 自助・共助で適切に防災活動を行う。 ・情報共有の必要性 様々な防災機関で配信されている防災情報は防災機関 同士の連携が不足している面もあり情報提供に改善の 余地がある。 共有化した防災情報を利用者に提供することで 利用者の自助、共助能力の向上を目指すシステ ムの構築を行う。
先行研究 共助を支援するシステム 中野 [1] は島田市の市民活 動団体のブログポータル サイト「 e コミュニティ しまだ」の記事の関連性 を図示することで、リス クコミュニケーションを し易い関係づくりを支援 した。
リスク情報サイト横断検索システム ・概要 地震防災対策強化地域の住民に複数の防災 機関が配信する情報を共有化した情報を提 供する。 ↓ 災害時の自助共助能力を向上を支援する。 中野のシステムを基に、防災情報に特化したシステムを構築する。
リスク情報サイト横断検索システム 検索窓にはキーワード (文章でも構いわな い)、もしくは記事 URL を入力することが できる。 検索ボタンを押すと ・浜松市の災害情報 ・静岡県の災害情報 ・気象庁 地震津波 ・内閣府一日前プロ ジェ クト 上記の四つの web サイ トから検索ワードとの 連想検索を行う。 検索窓の解説 図 2 :リスク情報サイト横断連想検索システム 検索窓 防災 「防災」と入力
関連ワードの解説 検索された記事の中に含まれる単語で重要性の高いものを関 連ワードとして、最大50件表示する。 キーワードをクリックすることで検索窓に入力でき、これを 用いて再検索することができる リスク情報サイト横断検索システム 図 3 :リスク情報サイト横断連想検索システム、関連ワード表示 部 防災 対策
グラフの解説 リスク情報サイト横断検索システム 図 4 :リスク情報サイト横断連想検索システム、グラフ 表示部 ノードを一件指定して連想検索ボタンを押すことで指定したノー ドの記事に対して類似度の高い記事を再検索することができる。 連想検索ボタン これはノードといい、記事を表している。ダブルクリックすることで 別ウインドウでその記事を表示する。 これは枝といい、記事と記事のつながりを表す。 最大 20 本表示する。 色の違いで文書の繋がりの強さを区別している。
連想検索 通常の単語検索はクエリ単語の出現回数から適合する 文 書を判断するが、連想検索は各文書の単語の出現パ ター ンから適合する文書を判断する。
連想検索 類似度計算 記事 → 単語連想検索 N : D の文書総数 df(t) : D における単語tを含む文 書数 #S : S に含まれる文書数 tf(t|d): 文書dにおける単語 t の頻度 tf(.|d): 文書dのすべての単語に関する tf(t|d) の 平均値 関連ワードを探し出す計算 対象データの文書集合 D の中の選択された文書集合 S における各語 t の類似度 ω(t|s) 関連ワードを抽出する文書群 (#S ) 対して 対象の単語(t) を含む文書が少な い、かつ 対象の単語( t ) を含む文書の中で t の頻度が高ければ類似度が高いと 判断する。
連想検索 類似度計算 単語 → 記事連想計画 dlen(b): 文書bの中の異なる単語の種類数 L: 文書集合 D における文書の異なる単語種類平均値 文書を単語の集まりとし、データベースから類似度の高い文書を選ぶ計算。 単語の数を n 個とし、それらの単語を t1,…..,tn としたときの文書bの類似 度。 文書を構成する単語の平均類似度を求めている。 文書の長さによる単語の種類の増加と単語の頻度の増加を考慮し、 Shinghal の文書長正規化を用いて補正している。 文書長正規化 n
近接度計算 Touchgraph で記事間の枝を表示するために計算する。 繋ぐ記事 2 件が含む総単語数に対して、共通の単語 数( F xy )が多ければ文書間に高い近接度があるとす る。 : 文書 x と文書 y の近接度 : 文書 x と文書 y が共に含む 単語の数 : 文書 x の持つ単語の数 : 文書 y の持つ単語の数
結果及び考察 「避難」をキーワードに入力した場合 図 5 :「避難」をキーワードに入力した場合 の出力
・静岡県は市をひと括りに 避難 勧告を出している。対し て浜 松市は市内の各地域に避 難 勧告を出している。 ・浜松市は市内の防災訓練 情 報を配信している。静岡 県は 県内の防災訓練情報の他 に 防災機関の国民保護訓練 の 情報を配信している。 出典: 【訓練】避難勧告等発令情報(防災局発表) 出典 : 「舞阪及び雄踏地域に避難勧告を発令」 防災機関の役割と影響の範 囲が読み取れる 結果及び考察 「避難」をキーワードに入力した場合
結論 考察より ・利用者に知りたい防災情報の総合的な知識を提 供する。 ・利用者にそれぞれの防災機関が行う防災対策の 違いを認識させる。 というシステムの目的を満たしていることを示 せた。 対象とする防災機関を増やすことで、より実用 的なシステムになると考えられる。
ご清聴ありがとうございました
結果及び考察 記事 「バイオトイレの寄贈がありま した」 で検索した結果 直接関係のある物資の話題の記事 の他に、「バイオトイレの寄贈が ありました」の記事の背景にある、 避難所の話題、医療の話題に関す る記事を検索した。 ユーザは意図した情報に関連する 情報を収集することが出来、総合 的な防災情報を得ることが出来る と考えられる。 図 6 :記事「バイオトイレの寄贈がありま した」 を入力した場合の出力
TouchGraph と GETA の応用 TouchGraph グラフ表示に利用した Java プログラム Java applet として利用 出来るため Web ブラウ ザ上で利用者がグラフ を操作することができ る(拡大、枝の伸縮、 グラフの回転等) 図 4 : TouchGraph
近接度計算 Touchgraph で記事間の枝を表示するために計算する。 単語の数の割に共通の単語数( F xy )が多ければ文書間に高い近接度 があるとする。 : 文書 x と文書 y の近接度 : 文書 x と文書 y が共に含む 単語の数 : 文書 x の持つ単語の数 : 文書 y の持つ単語の数
連想検索 汎用連想検索エンジン GETA 本研究ではデーターベース保 存、 文書検索、関連ワード抽出に使 用 した。 文書と単語頻度の関係を WAM と 呼ばれる仮想的な行列で表現す ることにより、文書検索のため の 必要な要素を効率よく収集し、 文書検索と関連ワード抽出に利 用 する類似度を計算する。 図 4 : WAM イメージ
出典: 【訓練】避難勧告等発令情報(防災局発表) 出典 : 「舞阪及び雄踏地域に避難勧告を発令」