マイクロブログではどの程度 流言が訂正されるのか? ―Twitter上での1年間の流言訂正情報の分析―

Slides:



Advertisements
Similar presentations
流言情報クラウド: 人間の発信した訂正情報の抽出による 流言収集 宮部 真衣 † 梅島 彩奈 ‡ 灘本 明代 ‡ 荒牧 英治 † † 東京大学知の構造化センター ‡ 甲南大学知能情報学部.
Advertisements

静岡大学情報学研究科 戸根木千洋 ユーザーイメージ収集 インターフェースの開発. 2 目次 背景と目的 研究の構成 研究の詳細 イメージ収集インターフェースの提案 映画イメージ収集システムの開発 システムの評価 今後の課題.
宮部 真衣 † ,荒牧 英治 † ,三浦 麻子 ‡ † 東京大学知の構造化センター ‡ 関西学院大学文学部.
アプリケーションターム ワークショップについての解説 rg-coordinator 12/11. 今回のワークショップのテーマ  アプリケーションにおける個人情報の取り 扱い 利用者やその属性を特定できる「個人情報」 インターネットでは利用者が意図しない個人 情報も利用できる  単に保護し、流さないようにするのではな.
嗜好ベクトルの近似による サービス享受条件の自動設定 立命館大学大学院 理工学研究科 データ工学研究室 ◎川成宗剛,山原裕之, 原田史子, 島川博光 2007 年 9 月 6 日.
位置情報履歴を利用した サービス提供機構の構築 慶応大学環境情報学部 4 年 徳田研究室 土田泰徳
ユーザーイメージ収集 インターフェイスの開発
顔表情クラスタリングによる 映像コンテンツへのタギング
TCPコネクションの分割 によるスループットの向上
クラスタ分析手法を用いた新しい 侵入検知システムの構築
RAMP(仮称) RADIO ACTIVITY MAPPING PROJECT
資料8-1 第11次大阪府鳥獣保護管理事業計画の概要
ISDASインターネット分散観測: ワームの平均寿命はいくらか?
相互評価システムの開発と大学情報科目における利用 柴田好章(名古屋大学大学院) 小川亮(富山大学教育学部)
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
情報の信憑性について ~情報を正しく判断する目を養うために~ 兵庫県教育委員会 平成29年3月14日 <タイトル>
神奈川大学大学院工学研究科 電気電子情報工学専攻
イシガイ類幼生の魚類への寄生状況 魚類を介した移動に関する研究
Observable modified Condition/Decision coverage
リンクパワーオフによる光ネットワークの省電力化
形態素解析および係り受け解析・主語を判別
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
需要予測システム WebForecastのご紹介
データ分析基礎c(2012年以降入学) 情報編集基礎c(2011年以前入学)
情報モラル ① 情報の信憑性 ~偽りの情報とトラブル~ 教員のICT活用指導力向上のための研修プログラム 兵庫県教育委員会
地理情報システム論演習 地理情報システム論演習
災害時に備えて 今できること こんな不安はありませんか? 災害時に助かるために!! 1つでも不安があれば、 中をご覧ください。
サーバ負荷分散におけるOpenFlowを用いた省電力法
プログラム実行履歴を用いたトランザクションファンクション抽出手法
需要パターンを考慮した 発注方式の比較検討
顔部品の検出システムの構築 指導教員 廉田浩 教授 1DS04188W  田中 甲太郎.
情報の信頼性・信憑性 震災の情報から考える
DNSトラフィックに着目したボット検出手法の検討
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
灌漑強度の違いに着目した 被覆灌漑の有効性の検討
情報モラル ①情報の信憑性 スライド資料 D1 ~情報を正しく判断する目を養うために~ 兵庫県版研修プログラム <タイトル>
Twitterのbotを活用した音楽広告の提案と分析
住宅用調理レンジを対象とした 排気フードの廃気捕集率に関する研究
コードクローン検出ツールを用いた ソースコード分析システムの試作と プログラミング演習への適用
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
ETPB:歩行者行動コンテクストの抽出 申請学生1: 諸富 賢 総合政策学部3年 申請学生2: 佐藤 文啓 環境情報学部1年
予測に用いる数学 2004/05/07 ide.
Androidアプリの作成 情報工学部情報工学科 07A1069 松永大樹.
移動エントロピーによる 動的ネットワーク化を用いた SNSと商品購買の相互関係の分析
エピソード記憶に訴えるBookmarkless Bookmarkの実現
SNS・ミニブログとは ネット上で色々なコミュニティの人とつながることができるサービス 学校・地元・趣味や友人の友人などとつながり、コミュニティを形成することもできる.
健診当日におけるオプション追加のメリット
マルウェアの通信履歴と 定点観測の相関について
Number of random matrices
ウィルスって どの位感染しているのかな? 菊池研究室  小堀智弘.
後藤滋樹研究室の紹介 現在のインターネットの課題 敵を知り、己を知れば、百戦危うからず(孫子) 1
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
東日本大震災後の小中学生の作文におけるポジティブな語り ~テキストマイニングによる分析~   ○いとう たけひこ(和光大学)    西野 美佐子(東北福祉大学) 日本教育心理学会第58回総会 ポスター発表 PG 01 サンポートホール高松1階展示場 2016年10月10日(日)在席10-11時.
項目間の対応関係を用いた XBRL財務報告書自動変換ツールの試作
マーカーの可読性を用いた 服薬状況認識による 高齢者見守りシステムの構築   情報工学部 情報工学科 石原研究室  09A2038   髙田 暢子.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
オブジェクトの協調動作を用いた オブジェクト指向プログラム実行履歴分割手法
ブースティングとキーワードフィルタリング によるシステム要求検出
設計情報の再利用を目的とした UML図の自動推薦ツール
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
迷惑メールは発信時刻を偽るか? 菊池研究室 鈴木 孝彰 水沼 暁.
コードクローン解析に基づく デザインパターン適用候補の検出手法
一問一答式クイズAQuAsにおける学習支援の方法
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
B2 – ruu B1 – yasukata 親 - amanoma
映像を用いた 「からだ気づき」実習教材の開発
Presentation transcript:

マイクロブログではどの程度 流言が訂正されるのか? ―Twitter上での1年間の流言訂正情報の分析― 宮部 真衣† 灘本 明代‡ 荒牧 英治† †京都大学 ‡甲南大学

Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ

背景 28,325名 34,482件 流言の拡散しにくい環境の構築が必要 マイクロブログの普及 東日本大震災(2011年3月11日) Twitterアクティブユーザ数:2.8億人 2012年,GlobalWebIndex調査 東日本大震災(2011年3月11日) Twitterなどのマイクロブログが 重要な情報インフラの1つとして活用された 一方,多くの流言も拡散された 関西電力が電力の提供を始めたようなので、コチラで節電すれば立派な支援になります。 【2011年3月】震災時 ユニークユーザ数 28,325名 流言関連ツイート数 34,482件 流言の拡散しにくい環境の構築が必要

流言の拡散防止 流言の拡散 流言に関する情報(訂正情報)の提供 人は,その情報が正しいと思って発信する つまり,流言であることを認識していない 流言に関する情報(訂正情報)の提供 東日本大震災では,流言に関する情報が 人手でまとめられ,提供されていた ユーザが情報を発信する前に,ユーザに対して その情報が流言である可能性を提示する

問題点と本研究の提案 提案 人手による訂正情報提供の問題点 誰かがまとめない限り,情報は提供されない 情報をまとめる人に負荷がかかる 提案 流言に関する情報をTwitterから 自動的に収集するシステム “流言情報クラウド”を構築 1年間システムを運用して 得られたデータから, その傾向を分析

Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ

流言情報クラウドの概要 流言に関する情報を収集し, ユーザの流言拡散防止を支援するサービス 流言に関する 情報を収集 流言情報を提供し 自動収集 ・・・・・ 手動登録 流言に関する 情報を収集 流言情報を提供し 流言拡散を防止

流言収集の自動化(1/3) 流言を収集・蓄積するためには, その情報の真偽を判別する必要がある 情報の真偽判定は 可能か?

TRUE or FALSE ? 月刊体育施設 という業界紙があるらしい.

流言収集の自動化(2/3) 情報の真偽は,人間でも判別が困難 流言情報の内容は多様 ある情報が流言であることを 正しく判別するには,正しい情報が必要 流言情報の内容は多様 地震が起きた時、社内サーバールームにいたのだが、ラックが倒壊した。腹部を潰され、血が流れている。痛い、誰か助けてくれ。 【拡散希望】中の人が今友達からメールで回ってきました。 関西地区にお住まいのみなさん。地震に伴い、関西電力が電力の提供を始めたようです。 ワンピースの作者 尾田栄一郎氏、地震の被害者救済に15億円を寄付 「自分が幸せになったということは、世の中から受けたひとつの借りだ」 ある情報が流言であることを 単純に判定するのは容易ではない

流言収集の自動化(3/3) 本研究では,流言訂正情報に着目

流言の訂正情報とは? 流言を直接検出するよりも 訂正情報の方が容易に検出できる可能性がある このツイートはデマです。RT xxx: 〇〇〇 本研究における定義 ある情報の不確かさを指摘している情報 訂正情報の傾向 訂正を明示する用語が含まれる場合が多い 「デマ」「間違い」「ガセ」「誤り」「嘘」など このツイートはデマです。RT xxx: 〇〇〇 〇〇〇は本当なの?嘘じゃないの? 〇〇〇というデマを広げた人間がいるみたいだね 流言を直接検出するよりも 訂正情報の方が容易に検出できる可能性がある

本研究のアプローチ 流言情報クラウドでは, 訂正情報を収集することにより, 間接的に流言を収集 ○○○○○は, デマらしいです. 流言 情報

流言情報クラウド 2012年6月から運用

Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ

分析の概要(1/2) 流言情報クラウドを1年間運用し, Twitterから収集した訂正ツイートを分析 2012年6月22日~2013年6月21日 分析に用いる訂正ツイート:39922 件 収集した訂正情報のうち,流言が明示的に 示されているものを使用 【例】 ネット上で「今日から7月」ってデマが飛び回っている様です。お気を付けください

分析の概要(2/2) 分析1 分析2 1日あたり/1年間に訂正される 流言はどの程度存在したのか? 1つの流言に対し,どの程度の 以下に関する調査結果を報告する 分析1 1日あたり/1年間に訂正される 流言はどの程度存在したのか? 分析2 1つの流言に対し,どの程度の 訂正ツイートが発信されたのか?

流言に関する表現の異なりの扱い 本研究では,異なる表現は まとめて1つの流言情報として扱う 1つの流言に対し,多様な表現が出現 iPhone が電子レンジで 充電できる iPhone を電子レンジで チンすると充電できる iPhone を電子レンジで チンすると直ぐに 充電ができる iPhone を電子レンジで チンすると 急速充電できる 本研究では,異なる表現は まとめて1つの流言情報として扱う

1日あたりの訂正ツイート数,訂正された流言数 (件) 訂正された流言数 平均 109.4 14.0 標準偏差 278.9 5.4 最大 4507.0 34.0 最小

1年間の訂正ツイート数 1年間に発信された訂正ツイート:39922 件

1年間の訂正された流言数 1日ごとに訂正された流言の数を算出

訂正ツイート数と訂正された流言数 地震でガレキの中に閉じ込められた、助けて (前日:震度5弱の地震発生) iPhoneを電子レンジでチンすると充電できる iPhoneを水に浸すと音質が良くなる トトロのメイちゃんは『死んでいる』 (前日:金曜ロードSHOW!で『となりのトトロ』放送) まとめ1 1 日あたりに訂正される流言数は平均14 件程度であるが,多数のユーザが訂正する特定の流言の出現により,訂正ツイート数が急激に増加する場合がみられた

流言あたりの訂正ツイート数の分布 まとめ2 1年全体で訂正された流言数:2953件 訂正された流言の大部分は訂正数が少なく,10件以上の訂正ツイートが投稿される流言は10%程度であった

訂正情報数の推移傾向 この2つの特徴に基づいて分類 一部のデータにおいて見られた特徴 1. 突出する部分がある 2. 長期間投稿が続く 訂正ツイートが10件以上ある流言288件の 時系列データを分析 一部のデータにおいて見られた特徴 1. 突出する部分がある 2. 長期間投稿が続く この2つの特徴に基づいて分類

ある流言の1日の最大訂正ツイート数 > 2×平均訂正ツイート数 分類の定義 【長期/短期の分類】 訂正情報の投稿が14日以上 ↓ 長期と分類 長期間 短期間 突出 平坦 突出/長期 型 突出/短期 型 平坦/短期 型 平坦/長期 型 【突出/平坦の分類】 ある流言の1日の最大訂正ツイート数 > 2×平均訂正ツイート数 ↓ 突出と分類

分類結果 短期 長期 計 突出 104件 35件 139件 平坦 143件 6件 149件 247件 41件 288件 【突出/短期】の例 コントレックスは被曝を防げる 韓国が“コリアン文明”を世界四大文明に追加 【突出/長期】の例 iPhoneを電子レンジでチンすると直ぐに充電ができる 子宮頸がんワクチンで不妊 短期 長期 計 突出 104件 35件 139件 平坦 143件 6件 149件 247件 41件 288件 平坦/長期は, 同一ユーザが 定期的に投稿 【平坦/短期】の例 東京湾のアナゴが7万Bq/kg ゴキブリにオロナミンC与え続けたらカブトムシになる 【平坦/長期】の例 Facebookじゃ稼げない この人は虫としゃべれる

本研究の限定性 まとめ2 ただし,訂正ツイートの多い流言 =拡散数の多い流言かどうかは不明 今後,実際に拡散された流言ツイートを分析し, 訂正された流言の大部分は訂正数が少なく,10件以上の訂正ツイートが投稿される流言は10%程度であった まとめ2 ただし,訂正ツイートの多い流言 =拡散数の多い流言かどうかは不明 今後,実際に拡散された流言ツイートを分析し, 訂正ツイートとの関係を明らかにする必要がある

Outline 背景と目的 流言情報クラウド 収集した訂正情報の分析 まとめ

本研究のまとめ 概要 分析 結果 今後の 課題 “流言情報クラウド”により,1年間 収集した流言訂正ツイートについて分析 訂正される流言数は平均14 件/日だが,特定の流言の出現により,訂正数が 急激に増加する場合がある 10件以上の訂正が投稿される流言は 10%程度であり,訂正された流言の 大部分は訂正数が少ない 分析 結果 今後の 課題 拡散された流言ツイートと訂正ツイートとの関係の分析

ご清聴ありがとうございました mai.miyabe@gmail.com