マイクロブログではどの程度 流言が訂正されるのか? ―Twitter上での1年間の流言訂正情報の分析― 宮部 真衣† 灘本 明代‡ 荒牧 英治† †京都大学 ‡甲南大学
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
背景 28,325名 34,482件 流言の拡散しにくい環境の構築が必要 マイクロブログの普及 東日本大震災(2011年3月11日) Twitterアクティブユーザ数:2.8億人 2012年,GlobalWebIndex調査 東日本大震災(2011年3月11日) Twitterなどのマイクロブログが 重要な情報インフラの1つとして活用された 一方,多くの流言も拡散された 関西電力が電力の提供を始めたようなので、コチラで節電すれば立派な支援になります。 【2011年3月】震災時 ユニークユーザ数 28,325名 流言関連ツイート数 34,482件 流言の拡散しにくい環境の構築が必要
流言の拡散防止 流言の拡散 流言に関する情報(訂正情報)の提供 人は,その情報が正しいと思って発信する つまり,流言であることを認識していない 流言に関する情報(訂正情報)の提供 東日本大震災では,流言に関する情報が 人手でまとめられ,提供されていた ユーザが情報を発信する前に,ユーザに対して その情報が流言である可能性を提示する
問題点と本研究の提案 提案 人手による訂正情報提供の問題点 誰かがまとめない限り,情報は提供されない 情報をまとめる人に負荷がかかる 提案 流言に関する情報をTwitterから 自動的に収集するシステム “流言情報クラウド”を構築 1年間システムを運用して 得られたデータから, その傾向を分析
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
流言情報クラウドの概要 流言に関する情報を収集し, ユーザの流言拡散防止を支援するサービス 流言に関する 情報を収集 流言情報を提供し 自動収集 ・・・・・ 手動登録 流言に関する 情報を収集 流言情報を提供し 流言拡散を防止
流言収集の自動化(1/3) 流言を収集・蓄積するためには, その情報の真偽を判別する必要がある 情報の真偽判定は 可能か?
TRUE or FALSE ? 月刊体育施設 という業界紙があるらしい.
流言収集の自動化(2/3) 情報の真偽は,人間でも判別が困難 流言情報の内容は多様 ある情報が流言であることを 正しく判別するには,正しい情報が必要 流言情報の内容は多様 地震が起きた時、社内サーバールームにいたのだが、ラックが倒壊した。腹部を潰され、血が流れている。痛い、誰か助けてくれ。 【拡散希望】中の人が今友達からメールで回ってきました。 関西地区にお住まいのみなさん。地震に伴い、関西電力が電力の提供を始めたようです。 ワンピースの作者 尾田栄一郎氏、地震の被害者救済に15億円を寄付 「自分が幸せになったということは、世の中から受けたひとつの借りだ」 ある情報が流言であることを 単純に判定するのは容易ではない
流言収集の自動化(3/3) 本研究では,流言訂正情報に着目
流言の訂正情報とは? 流言を直接検出するよりも 訂正情報の方が容易に検出できる可能性がある このツイートはデマです。RT xxx: 〇〇〇 本研究における定義 ある情報の不確かさを指摘している情報 訂正情報の傾向 訂正を明示する用語が含まれる場合が多い 「デマ」「間違い」「ガセ」「誤り」「嘘」など このツイートはデマです。RT xxx: 〇〇〇 〇〇〇は本当なの?嘘じゃないの? 〇〇〇というデマを広げた人間がいるみたいだね 流言を直接検出するよりも 訂正情報の方が容易に検出できる可能性がある
本研究のアプローチ 流言情報クラウドでは, 訂正情報を収集することにより, 間接的に流言を収集 ○○○○○は, デマらしいです. 流言 情報
流言情報クラウド 2012年6月から運用
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
分析の概要(1/2) 流言情報クラウドを1年間運用し, Twitterから収集した訂正ツイートを分析 2012年6月22日~2013年6月21日 分析に用いる訂正ツイート:39922 件 収集した訂正情報のうち,流言が明示的に 示されているものを使用 【例】 ネット上で「今日から7月」ってデマが飛び回っている様です。お気を付けください
分析の概要(2/2) 分析1 分析2 1日あたり/1年間に訂正される 流言はどの程度存在したのか? 1つの流言に対し,どの程度の 以下に関する調査結果を報告する 分析1 1日あたり/1年間に訂正される 流言はどの程度存在したのか? 分析2 1つの流言に対し,どの程度の 訂正ツイートが発信されたのか?
流言に関する表現の異なりの扱い 本研究では,異なる表現は まとめて1つの流言情報として扱う 1つの流言に対し,多様な表現が出現 iPhone が電子レンジで 充電できる iPhone を電子レンジで チンすると充電できる iPhone を電子レンジで チンすると直ぐに 充電ができる iPhone を電子レンジで チンすると 急速充電できる 本研究では,異なる表現は まとめて1つの流言情報として扱う
1日あたりの訂正ツイート数,訂正された流言数 (件) 訂正された流言数 平均 109.4 14.0 標準偏差 278.9 5.4 最大 4507.0 34.0 最小
1年間の訂正ツイート数 1年間に発信された訂正ツイート:39922 件
1年間の訂正された流言数 1日ごとに訂正された流言の数を算出
訂正ツイート数と訂正された流言数 地震でガレキの中に閉じ込められた、助けて (前日:震度5弱の地震発生) iPhoneを電子レンジでチンすると充電できる iPhoneを水に浸すと音質が良くなる トトロのメイちゃんは『死んでいる』 (前日:金曜ロードSHOW!で『となりのトトロ』放送) まとめ1 1 日あたりに訂正される流言数は平均14 件程度であるが,多数のユーザが訂正する特定の流言の出現により,訂正ツイート数が急激に増加する場合がみられた
流言あたりの訂正ツイート数の分布 まとめ2 1年全体で訂正された流言数:2953件 訂正された流言の大部分は訂正数が少なく,10件以上の訂正ツイートが投稿される流言は10%程度であった
訂正情報数の推移傾向 この2つの特徴に基づいて分類 一部のデータにおいて見られた特徴 1. 突出する部分がある 2. 長期間投稿が続く 訂正ツイートが10件以上ある流言288件の 時系列データを分析 一部のデータにおいて見られた特徴 1. 突出する部分がある 2. 長期間投稿が続く この2つの特徴に基づいて分類
ある流言の1日の最大訂正ツイート数 > 2×平均訂正ツイート数 分類の定義 【長期/短期の分類】 訂正情報の投稿が14日以上 ↓ 長期と分類 長期間 短期間 突出 平坦 突出/長期 型 突出/短期 型 平坦/短期 型 平坦/長期 型 【突出/平坦の分類】 ある流言の1日の最大訂正ツイート数 > 2×平均訂正ツイート数 ↓ 突出と分類
分類結果 短期 長期 計 突出 104件 35件 139件 平坦 143件 6件 149件 247件 41件 288件 【突出/短期】の例 コントレックスは被曝を防げる 韓国が“コリアン文明”を世界四大文明に追加 【突出/長期】の例 iPhoneを電子レンジでチンすると直ぐに充電ができる 子宮頸がんワクチンで不妊 短期 長期 計 突出 104件 35件 139件 平坦 143件 6件 149件 247件 41件 288件 平坦/長期は, 同一ユーザが 定期的に投稿 【平坦/短期】の例 東京湾のアナゴが7万Bq/kg ゴキブリにオロナミンC与え続けたらカブトムシになる 【平坦/長期】の例 Facebookじゃ稼げない この人は虫としゃべれる
本研究の限定性 まとめ2 ただし,訂正ツイートの多い流言 =拡散数の多い流言かどうかは不明 今後,実際に拡散された流言ツイートを分析し, 訂正された流言の大部分は訂正数が少なく,10件以上の訂正ツイートが投稿される流言は10%程度であった まとめ2 ただし,訂正ツイートの多い流言 =拡散数の多い流言かどうかは不明 今後,実際に拡散された流言ツイートを分析し, 訂正ツイートとの関係を明らかにする必要がある
Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ
本研究のまとめ 概要 分析 結果 今後の 課題 “流言情報クラウド”により,1年間 収集した流言訂正ツイートについて分析 訂正される流言数は平均14 件/日だが,特定の流言の出現により,訂正数が 急激に増加する場合がある 10件以上の訂正が投稿される流言は 10%程度であり,訂正された流言の 大部分は訂正数が少ない 分析 結果 今後の 課題 拡散された流言ツイートと訂正ツイートとの関係の分析
ご清聴ありがとうございました mai.miyabe@gmail.com