KeyGraphを活用した 食品安全リスクの 早期警告支援 システム工学科 環境分野 前田研究室 5021ー3075 古谷寿基 2006/2/23
発表の内容 はじめに Key Graph 本研究の目的 解析について 解析結果 結論と課題
西尾清孝.「KeyGraphを用いた食品安全リスク はじめに 近年、様々な食品安全リスクが存在しており、未知のリスクも多数存在していると考えられる そういったリスクを早期に発見出来れば、リスクを最小限に抑えることが出来るのでは? そこで先行研究ではチャンス発見の考えに基づき、 食品安全に関するリスクのチャンスを発見することを目指した 早期警告支援システムを構築した。 先行研究 西尾清孝.「KeyGraphを用いた食品安全リスク 早期警告支援システム」
KeyGraph(1) Key Graphとは? チャンス発見に利用されるツール 文章構成のキーワード抽出 チャンス発見に利用されるツール 文章構成のキーワード抽出 文章の単語と単語の関係性をノードと線 でマップ上に可視化するソフト
KeyGraph(2) 黒ノード 実線と黒ノードの塊 二重丸ノード 高頻出語 対象文章中で近くに出現しやすい高頻出語の塊 文章中で「塊中の語」と「文章中のある語」が近くに出現しがちで、 尚かつ、語がいくつもの点線と接していると主張を現すかもしれないという語 点線 :「黒ノードと実線の塊中の単語」と「文章中のある単語」が近くに出現しがちな場合 KeyGraphの出力結果
KeyGraph(3) 赤ノード 実線と黒ノードからなる塊と塊を繋いでおり、黒ノードになれなかった頻度の低い語 しかし・・・・・ 頻度は低いが、解析結果全体 では重要な位置を占める事が 多い 赤ノード自身と周りのノードとの繋がりに注目することでチャンスの発見に繋がるかもしれないと考えられる。 繋がる KeyGraphの出力結果
本研究の目的 先行研究で構築されたシステムの評価 新たなシステムの構築を視野に入れた早期警告支援システムの提案 本研究の目的は 先行研究で構築されたシステムの評価を行い、その上で 新たなシステムの構築を視野に入れた早期警告支援システムの提案 を行うことである。 新たなシステムの構築を視野に入れた早期警告支援システムの提案
新たなシステムの考案 システムの評価を行った結果 先行研究で構築されたシステムを土台とし、 解析データの変更を行うに至った そこで・・・・・ 解析データの変更を行うに至った そこで・・・・・ 先行研究ではHTMLファイル文章を解析し、リスクを発見しようとしたが、 本研究では朝日新聞記事データ集を使用した。 HTMLファイル文章 朝日新聞記事データ集(2002,2003,2004年)
朝日新聞記事データ集 朝日新聞記事データ集とは・・・ 朝日新聞社の約16万件に及ぶ1年分の記事テキストが納められたデータ集 2002年、2003年、2004年 総合・家庭・政治・社会・科学面 以上を利用する この新聞記事データを 2002,3,4年分利用し、 解析を行う記事は総合・家庭・政治・社会・科学面の記事を 利用することにした。
ユーザーインターフェース 解析データ 任意語検索 新聞記事データ内からキーワードを含んだ記事を収集 各キーワードは掲載年と掲載月ごとに分けて表示 任意語検索 新聞記事データ内を任意の語で検索出来る キーワード Key Graphで解析を行う対象を選択するユーザーインターフェースについて解説します。 ここで選択した記事データをKey Graphにて解析します また、任意語検索については各年の新聞記事データから 任意の語を含んだ記事を検索し表示出来ます。 任意語検索
解析について(1) 2002年7月に 記事数が大幅に増加している 2002年7月以前に 予兆が現れていないか? 図:残留農薬2002年7月記事(13件)解析結果 2002年7月に 記事数が大幅に増加している 2002年 2003年 2004年 2002年7月以前に 予兆が現れていないか? 2002年7月の解析結果を見ると中国産の残留農薬についての話題が中心で 何か残留農薬について問題が起こったという事が分かる。 その問題の予兆が2002年7月以前の記事に現れていないか? 図:残留農薬の記事数の年ごとの推移
解析について(2) 2002年7月の出来事の予兆を発見する為に 2002年7月以前の記事を解析する 残留農薬に関連する語から予兆発見を目指す 残留農薬の問題の多くが「中国産」の食品 「検疫所」では輸入された食品の汚染を検査している 以上より 「中国産」「検疫」を含む2002年7月以前の月の記事を解析することで予兆発見を目指す
解析結果1「中国産」(1) 入力ファイル:「中国産」を含んだ2002年3月記事 図右下部に 「残留農薬」「野菜」「検査」の塊 「中国産」野菜における残留農薬のリスクの予兆を示しているでは? 図:「中国産」2002年3月記事(3件)解析結果
解析結果2 「中国産」(2) 入力ファイル:「中国産」を含んだ2002年4月記事 図上部に「中国産」「抗生」「物質」「検査」というような語が集まっている。 赤ノードの「蜂蜜」に「検査」を通して繋がっている これらの語に関係するような リスクが蜂蜜にあるのでは? 図:「中国産」2002年4月記事(6件)解析
解析結果3「検疫」 入力ファイル:「検疫」を含んだ2002年4月記事 「蜂蜜」と「検査」が赤ノードの「抗生」「物質」で繋がっている。 この繋がりから「蜂蜜」が抗生物質の「検査」を必要とする様なリスクをはらんでるのでは? 図:「検疫」2002年4月記事(3件) 解析
図:「渡り鳥」and「ふん」2004年1月記事(4件)解析 解析結果4「渡り鳥」&「ふん」 入力ファイル: 「渡り鳥」&「ふん」を含んだ2004年1月記事 2004年1月10日ごろに鳥インフルエンザが発生している 予兆ではない しかし これは鳥インフルエンザについて解析するため 関連した「渡り鳥」「ふん」を含んだ2004年1月記事を解析した結果である。 すでに事象が起こった後であるので予兆では無いが ・・・・のように鳥インフルエンザのリスクマネジメントを 考える上で・・・ 「野鳥」「接触」「家畜」「香港」といったように、鳥インフルエンザのリスクマネジメントを考える上で重要な語が現れている。 図:「渡り鳥」and「ふん」2004年1月記事(4件)解析
結論 今回使用した新聞記事データを解析データとすることで、リスクの予兆と考えられる語もKeyGraphの出力結果には現れた また、 解析結果4( 「渡り鳥」&「ふん」 )のように事象が起こった後の解析結果には、その事象のリスクマネジメントを考える上で重要な語が現れた
課題 そこで、さらなる解析結果の向上の為に 今回使用した新聞記事面以外の面も考慮する 国際面・地域面…等 今回解析を行った関連語以外にも様々な関連語を考え解析を行う 総合・家庭・政治・社会・科学