A16 - SNSから漏れるプライバシー情報の調査 菊池研究室 宮井 一樹
SNSとは? Social Networking Service Mixi Gree MySpace など。
SNSの問題点
研究の目的 実体を明らかにし、 ユーザーに警告する。
情報収集 http://mixi.jp/show_friend.pl?id=ランダムID 名前 出身地 現住所 IDネーム 年齢 ログイン時間 年齢 血液型 趣味 職業 自己紹介 出身小学校 出身中学校 その他 コミュニティ
比較方法 項目別比較 年齢、血液型などで比較 モデル別比較 客観モデルと主観モデル2つの比較
項目別比較 出身校 記入者(4%) 血液型 記入者(74%) 職業 記入者(42%) 全体 出身地 市町村名記載 50% 4/8 42% 63/149 55% 47/85 34% 67/200 出身地県名記載 75% 6/8 60% 89/149 78% 66/85 49% 96/200 24時間以内 ログイン 63% 5/8 47% 70/149 52% 44/85 28% 55/200 年齢記載 78/149 64/85 45% 90/200
出身校記入者属性 10代 1 20代 5 30代 その他 不明 2 A 3 B O AB 1 不明 年齢分布 血液型分布
客観モデル 日本の総人口:約127,687,000人 2^27=134,217,728 2^28=268,435,456 情報項目 絞り込み量[bit] 備考 本名 27 同姓同名を考慮しないと一意に決定できる 住所 26 ほぼ一意に決定できる 町名 14 47*17*30 市町村名 9 47*17 県名 6 47都道府県 日本の総人口:約127,687,000人 2^27=134,217,728 2^28=268,435,456
主観モデル 1 2 3 4 5 地域情報が一切漏えいしておらず、 特定が非常に困難である。 出身地、現住所の一方より 県名の情報が漏えいしている状態。 3 出身地、現住所の一方より市町村名漏えいして、 日記などを読めば特定できる可能性がある状態。 4 出身地、現住所の両方が漏えいしていて 地域が特定できる状態。 5 出身校などが漏えいしていて、 町名以下で地域が特定できる。
客観モデルと主観モデルの比較 主観モデル [level] 客観モデル 絞り込み量[bit]
例 31bit - レベル4の場合 26bit - レベル2の場合 性別 年齢 血液型 現住所 出身地 職業 趣味 合計 1bit 6bit = 31bit 男 20歳 A 三重県津市 学生 酒 26bit - レベル2の場合 性別 年齢 血液型 現住所 出身地 職業 趣味 合計 1bit 6bit 4bit = 26bit 男 20歳 A 三重県 学生 酒
まとめ 1,683万ユーザー × 4% = 673,200ユーザー 改善点 乱数のみプログラム ⇒情報収集までプログラム化