Presentation is loading. Please wait.

Presentation is loading. Please wait.

地域ウェブ空間における構造特性と抽出の研究:八王子周辺地域

Similar presentations


Presentation on theme: "地域ウェブ空間における構造特性と抽出の研究:八王子周辺地域"— Presentation transcript:

1 地域ウェブ空間における構造特性と抽出の研究:八王子周辺地域
-2004年3月5日(金)- 第2回 「ネットワーク生態系と空間デザイン」シンポジウム 東京工科大学メディア学部  学籍番号 00P033 石村 享久 東京工科大学 メディア学部 石村享久

2 目次 - 背景と研究目的 - - データと考察 - - 地域ウェブ空間メトリックス - - 今後の課題 - - おわりに -
インターネット空間生態系アーキテクチャ 目次 - 背景と研究目的 - 1.1.背景 1.2.研究目的 - 地域ウェブ空間メトリックス - 2.地域ウェブ空間メトリックス 2.1.地形的捉え方 2.1.1.地形的捉え方(補足1) 2.1.2.地形的捉え方(補足2) 2.2.クラスタ構造 2.3.リンクハブと被リンクハブ 2.4.リンクの種類 2.5.連結度と連結密度 2.6.連結位置と方向 大陸や島の変化 - ツールの説明 - 3.ツールの説明 - データと考察 - 4.1.データ取得対象地域 4.2.地域ウェブ空間サイズ 4.3.地域ウェブ空間の大陸のデータ   地域ウェブ空間の大陸のグラフ 4.3.1.可視化データ 4.4.リンクハブ・被リンクハブ 4.5.連結度と連結密度 4.6.連結位置と連結方向 - 今後の課題 - 5.今後の課題 - おわりに - 6.おわりに - 謝辞 - - 参考文献 - 東京工科大学 メディア学部 石村享久

3 1.1.背景 様々なネットワークの存在 病気の感染ルート ネットワークとは そのネットワーク自身の特徴 ノードとリンクで成り立つもの
インターネット空間生態系アーキテクチャ 1.背景と研究目的 1.1.背景 病気の感染ルート WWW情報空間 食物連鎖 論文の参考文献 細胞内生化学反応 遺伝子の染色体 コンピュータウイルス 様々なネットワークの存在 そのネットワーク自身の特徴 ネットワーク共通(普遍的)性質 ネットワークとは ノードとリンクで成り立つもの A B ノード リンク 分野 : ネットワーク分析  ネットワークという分野で世の中を考えていく。 東京工科大学 メディア学部 石村享久

4 サイトを利用した連絡手段の作成を考える。
インターネット空間生態系アーキテクチャ 1.背景と研究目的 1.2.研究目的 本研究 : 地域ウェブ空間の構造特性解明 活動内容 評価指標(メトリックス)の考案 各メトリックス項目に対して取得ツール作成 データの取得と考察(現状把握) 対象地域 八王子とその周辺の7地域 (前期は八王子と三鷹) 協力 山形大学 北陸先端科学技術大学院大学 地域ウェブ空間の構造 サイトを利用した連絡手段の作成を考える。 地域の活性化を考える。 他の都市との交流を考える。 構造解明 インターネット空間を含めた都市デザイン 可視化 比較 地域ウェブ空間の生態系 成長における規則性解明 定点観察 比較 地域ウェブ空間の利用状況 サイト視聴率 リンク通過経路 東京工科大学 メディア学部 石村享久

5 2.地域ウェブ空間メトリックス 2.地域ウェブ空間メトリックス メトリックス項目 インターネット空間生態系アーキテクチャ
WWWネットワークの指標 地域独特の指標 地域ウェブ空間 地域単体を見る 地形的捉え方 大陸 中央大陸 IN大陸 OUT大陸 半島 トンネル クラスタ構造 クラスタリング係数 無向グラフ隔たり数 ハブの存在 リンクハブ 被リンクハブ リンクの種類 地域ウェブ空間内部リンク 地域ウェブ空間外部リンク 2地域の関係を見る 連結度 連結密度 連結位置(位置と方向) 大陸や島の変化 東京工科大学 メディア学部 石村享久

6 2.1.地形的捉え方 ※1. 中央大陸が複数存在した場合は、最も大きなものを中央大陸とする。
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.1.地形的捉え方 中央大陸 この部分に含まれる2つのサイトは任意のリンクを通って行き来できる。(自サイトへ戻ることができる) IN大陸 中央大陸に辿り着けるが、中央大陸からは戻れない。 OUT大陸 中央大陸から出た先だが、中央大陸へ戻れない。 半島 IN大陸やOUT大陸に接続しているが他には接続していない。 トンネル IN大陸からOUT大陸へ向かうが、中央大陸を通過しない。 大陸とは繋がっていない。 ※1. 中央大陸が複数存在した場合は、最も大きなものを中央大陸とする。 ※2. 半島としかリンクを持たないサイトは、半島に含める。 補足. 向き付けの存在するネットワークでは以上の地形にわけることができる。    . WWW空間では、中央大陸:IN大陸:OUT大陸:半島と島=1:1:1:1 東京工科大学 メディア学部 石村享久

7 2.1.1.地形的捉え方(補足1) ※1. 中央大陸が複数存在した場合は、最も大きなものを中央大陸とする。
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.1.1.地形的捉え方(補足1) ※1. 中央大陸が複数存在した場合は、最も大きなものを中央大陸とする。 中央大陸である  A,B,Cの中央大陸と、D,Eの中央大陸があるが、A,B,Cの方が大きいので、そちらを中央大陸とする。 (中央大陸は1つだけとする。この図の場合、D,EはIN大陸とする) 中央大陸ではない B D A E C ※2. 半島としかリンクを持たないサイトは、半島に含める。  半島(IN部分)はAがIN大陸のとき、B,Cが半島となるが、DはIN部分から来ることは出来ない。この場合、Dは半島(IN部分)に含んでしまう。  半島(OUT)やトンネルに関しても同様に行う。 A B C D 半島に含めてしまう 東京工科大学 メディア学部 石村享久

8 2.1.2.地形的捉え方(補足2) 左図のようなネットワークでは IN大陸 中央大陸 OUT大陸 半島IN部分 半島OUT部分 S
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.1.2.地形的捉え方(補足2) 左図のようなネットワークでは IN大陸 中央大陸 OUT大陸 半島IN部分 半島OUT部分 S ・ 地形的捉え方はこのようになり ・ Sの文字からリンクで移動する場合  辿り付けるサイトは限られる。 S  本来、IN大陸や島はリンクを辿ることでは探 し出せないのだが、先にノードを用意して、そ のネットワークを地形的に分けていく場合、 IN大陸や島を含めた分類が可能になる。 S 東京工科大学 メディア学部 石村享久

9 2.2.クラスタ構造 A E B G D F H C I J 2.地域ウェブ空間メトリックス クラスタ(集まり)を作ろうとする性質
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.2.クラスタ構造 クラスタ1      クラスタ2 コミュニティA  サイトA  サイトB  サイトC  サイトD コミュニティC  サイトH  サイトI  サイトJ A D B C E F H J I G コミュニティB  サイトE  サイトF  サイトG クラスタ(集まり)を作ろうとする性質 クラスタリング係数(任意のノードの知り合い2つがまた知り合いである確率) 隔たり数(そのクラスタ内部間の平均経路長) クラスタリング係数と隔たり数は、リンク関係のあるクラスタごとに調べる (ただし、無向グラフとして考える) 補足. クラスタリング係数は一般的なネットワークでは0.50の値を取ると言われている。    . WWW空間は19次の隔たり(1998年)であった。 東京工科大学 メディア学部 石村享久

10 2.3.リンクハブと被リンクハブ ハブとはリンクを多く所持している存在のことである。
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.3.リンクハブと被リンクハブ ハブとはリンクを多く所持している存在のことである。 向き付けのネットワークでは、リンクするハブ(リンクハブ)とリンクされるハブ(被リンクハブ)は同一のものとは限らない。 リンクハブ(多くリンクしている) 被リンクハブ(多くリンクされている) 補足. ハブの存在は、サイト数とそのサイトの所持リンク数をグラフにするとベキ法則をとる    . ハブには80対20の法則がある。(ネットワークの2割のノードが8割のリンクを所持している) 東京工科大学 メディア学部 石村享久

11 2.4.リンクの種類 地域ウェブ空間 サイトA サイトB 2.地域ウェブ空間メトリックス ウェブドキュメント ウェブドキュメント
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.4.リンクの種類 ウェブドキュメントを点として、サイトを考える 内部リンク 外部リンク サイトを点として、地域ウェブ空間を考える 地域ウェブ空間内部リンク 地域ウェブ空間外部リンク 地域ウェブ空間 サイトB ウェブドキュメント サイトA ウェブドキュメント 内部リンク 外部リンク ウェブドキュメント 地域ウェブ空間内部リンク 地域ウェブ空間外部リンク 東京工科大学 メディア学部 石村享久

12 2.5.連結度と連結密度 = 2.地域ウェブ空間メトリックス 連結度
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.5.連結度と連結密度 連結度  連結度は片方の地域ウェブ空間のサイトから、もう片方の地域ウェブ空間へのリンク数を数える。(左図の場合AからBは6の値となる) 連結密度  連結密度は2つの地域ウェブ空間のサイト数から、ひくことのできる最大リンク数を考え、実際のリンク数の数を考える。 6 = 実際のリンク数 Aのサイト数×Bのサイト数 4 +4 +4 地域ウェブ空間A 地域ウェブ空間B 東京工科大学 メディア学部 石村享久

13 2.6.連結位置と連結方向 大陸や島の変化 WWWのリンクは向き付けのネットワークなので連結位置と方向を見ることができる。
インターネット空間生態系アーキテクチャ 2.地域ウェブ空間メトリックス 2.6.連結位置と連結方向     大陸や島の変化  WWWのリンクは向き付けのネットワークなので連結位置と方向を見ることができる。  他方のクラスタへのリンクが存在する場合、結合後クラスタの数が減ることになる。(単純な足し算にならない) 地域情報空間A 地域情報空間B ひとつの大陸となる 単純な足し算なら… +              = このようなリンク関係があるなら 東京工科大学 メディア学部 石村享久

14 3.ツールの説明 カテゴリ情報入手ツール [ Visual Basic 6.0 ] [ 山形大学 ]
インターネット空間生態系アーキテクチャ 3.ツールの説明 3.ツールの説明 サイトのリストアップ リンク関係 カテゴリ情報入手ツール [ Visual Basic 6.0 ] [ 山形大学 ]  Yahooサイト内の指定したカテゴリに含まれるサイトをリストアップする。 リンク関係判別ツール [ Visual Basic 6.0 ] [ 山形大学 ]  リストアップしたサイト間のリンクを探し出す。 地形的捉え方判別ツール [ Java ] [ 東京工科大学 ]  得られたリンク関係を用いて、地形的判別を行う。  各サイトのデータを出力する。 可視化ツール [ Java ] [ 北陸先端科学技術大学院大学 ]  得られたリンク関係を用いて、ネットワーク空間を可視化する。  クラスタリング係数・隔たり数の計算を行う。 可視化データ サイト情報 各クラスタ情報 東京工科大学 メディア学部 石村享久

15 4.1.データ取得対象地域 対象地域:八王子とその周辺地域 昭島 あきる野 58サイト 80サイト 日野 檜原 89サイト 八王子
インターネット空間生態系アーキテクチャ 4.データと考察 4.1.データ取得対象地域 対象地域:八王子とその周辺地域 八王子と周辺地域                 昭島    あきる野                          日野 檜原              八王子                          町田         相模原                 58サイト    80サイト                          89サイト 18サイト              462サイト                          361サイト         533サイト    Yahoo登録サイト  総1601サイト  (12月28日) (画像)yahoo地図情報 東京工科大学 メディア学部 石村享久

16 4.2.地域ウェブ空間サイズ 4.データと考察 インターネット空間生態系アーキテクチャ 地域名 地域ウェブ空間サイト数 リンクを持つサイト数
最も大きいクラスタ(大陸) 次に大きいクラスタ(最も大きい島) 檜原 18サイト 14サイト 1サイト 昭島 58サイト 19サイト 13サイト 3サイト あきる野 80サイト 42サイト 日野 89サイト 50サイト 46サイト 町田 361サイト 152サイト 142サイト 2サイト 八王子 462サイト 209サイト 177サイト 5サイト 相模原 533サイト 203サイト 174サイト 大陸が地域ウェブ空間の占める割合(%) 77.8% 22.4% 52.5% 51.7% 39.3% 38.3% 32.6% 42.3% 7地域 1601サイト 759サイト 677サイト 5サイト リンクを持つサイトの大部分で形成される大きなクラスタ(大陸)の存在 地域ウェブ空間の規模に関係なく、島は比較的小さなクラスタのみとなる 地域ウェブ空間内のリンクでは5割6割のサイトへ到達(移動)不可能ということになる ※)次に大きいクラスタ(リンク関係があるもの)が存在しない場合、孤立したサイトが存在するので1を表示 東京工科大学 メディア学部 石村享久

17 4.3.地域ウェブ空間の大陸データ 4.データと考察 地形を4つに分類 地形を3つに分類(島を除く) インターネット空間生態系アーキテクチャ
サイト数 クラスタリング係数 隔たり数 大陸内 IN大陸 中央大陸 OUT大陸 半島IN大陸側 半島OUT大陸側 トンネル 檜原 14 中央大陸が複数存在するため判別ができません 0.5889 1.791 昭島 13 3 4 5 1 0.6709 2.243 あきる野 42 8 21 7 0.4411 2.616 日野 46 10 20 16 0.5847 2.244 町田 142 52 19 18 51 2 0.4518 3.432 八王子 177 63 17 39 0.3605 3.173 相模原 174 60 53 25 32 0.4719 3.538 7地域 677 191 172 190 88 24 12 0.4235 3.934 地形を4つに分類 (IN大陸/中央大陸/OUT大陸/半島) 地形を3つに分類(島を除く) (IN大陸と半島IN部分/中央大陸とトンネル/OUT大陸と半島OUT側) 東京工科大学 メディア学部 石村享久

18 4.3.地域ウェブ空間の大陸グラフ 4.データと考察 インターネット空間生態系アーキテクチャ
大陸内を、IN大陸・中央大陸・OUT大陸・半島(トンネル含む)の4要素で分けた場合 大陸内を、IN大陸側(IN大陸と半島IN部分)・中央大陸側(中央大陸とトンネル)・OUT大陸側(OUT大陸と半島OUT部分)で分けた場合 ※)檜原は地形的捉え方ができない地域ウェブ空間なので上の2つのグラフに含んでいません 東京工科大学 メディア学部 石村享久

19 4.3.1.可視化データ 4.データと考察 インターネット空間生態系アーキテクチャ ※ クロスエントロピーによる可視化
檜原  昭島   あきる野 日野 14サイト 13サイト 42サイト 46サイト 町田 八王子 相模原 7地域 142サイト 177サイト 174サイト 677サイト ※ クロスエントロピーによる可視化 (可視化には他に、多次元尺度法、ばねモデル、などがある。) 東京工科大学 メディア学部 石村享久

20 4.4.リンクハブ・被リンクハブ 4.データと考察 インターネット空間生態系アーキテクチャ リンク上位5つ
(1位から5位の数は所持リンク数) 檜原 昭島 あきる野 日野 町田 八王子 相模原 14 13 42 46 142 177 174 1位 6 26 31 25 38 51 32 2位 18 24 36 43 29 3位 10 21 20 41 27 4位 5 11 5位 4 19 被リンク上位5つ (1位から5位の数は所持リンク数) 檜原 昭島 あきる野 日野 町田 八王子 相模原 14 13 42 46 142 177 174 1位 27 11 28 64 66 61 2位 9 7 21 54 49 3位 5 10 19 53 12 4位 3 4 48 5位 2 18 IN大陸 中央大陸 OUT大陸 ※1)地域の名前の下の数は、リンクを所持しているサイト数(単独のサイトを除いた数) ※2)各サイトの所持リンク数は他の6地域とのリンクも含む この丸で囲まれているサイトは、外部とのリンクを混ぜない場合でも上位5位に入っている 東京工科大学 メディア学部 石村享久

21 4.5.連結度と連結密度 4.データと考察 インターネット空間生態系アーキテクチャ 連結度 連結密度(x1000)
檜原 昭島 あきる野 日野 町田 八王子 相模原 10 3 12 15 9 14 6 7 21 1 2 19 36 16 23 45 85 8 60 43 47 5 89 50                    TO FROM (サイト数 18) (58) (80) (89) (361) (462) (533) 連結密度(x1000) 檜原 昭島 あきる野 日野 町田 八王子 相模原 6.944 2.873 0.646 2.324 0.716 0.447 0.291 9.722 1.293 0.983 0.519 0.568 0.023 0.624 0.387 0.280 0.591 0.875 0.337 0.307 0.334 0.207 0.715 0.269 0.441 0.120 0.298 0.270 1.459 0.257 0.190 0.104 0.161 0.400 0.259 0.361                     TO FROM (サイト数 18) (58) (80) (89) (361) (462) (533) 東京工科大学 メディア学部 石村享久

22 4.6.連結位置と連結方向 4.データと考察 インターネット空間生態系アーキテクチャ IN大陸 中央大陸 OUT大陸 半島IN 半島OUT
トンネル 76 94 58 89 2 56 12 68 25 23 1 6 5 3 38 9 11 41 16 To From サイト数 193 121 124 135 18 3 993 東京工科大学 メディア学部 石村享久

23 5.今後の課題 5.今後の課題 メトリックスへのフィードバックは? 既存ツールの改良点は?
インターネット空間生態系アーキテクチャ 5.今後の課題 5.今後の課題  メトリックスへのフィードバックは?  リンクの重みを測るBetweennessを用いたコミュニティ抽出方法  既存ツールの改良点は?  GUIを含め、ツールの使いやすさを考える  対象地域を増やして、地域ウェブ空間の共通的性質を考える  地域を結合し大きな集まりとしたときのフラクタル構造や相似を考える  同じ対象地域の一定期間おきの定点観察(本研究は12月のみのデータ) 東京工科大学 メディア学部 石村享久

24 6.おわりに 本研究(地域ウェブ空間ネットワークの構造解明)を経て… 6.おわりに
インターネット空間生態系アーキテクチャ 6.おわりに 6.おわりに 本研究(地域ウェブ空間ネットワークの構造解明)を経て…  インターネット空間の指標に地形的捉え方を加えたかたちで地域ウェブ空間のデータを取ることに成功した。 大陸の存在の確認 島が小さくなる リンクハブと被リンクハブは別のものになる (リンクハブはIN大陸と中央大陸、被リンクハブはOUT大陸が多い)  連結度や連結位置といった地域ウェブ空間独特の指標のデータを取ることに成功した。 IN大陸から多くリンクする傾向の発見 結合後の大陸と島の変化の確認 東京工科大学 メディア学部 石村享久

25 謝辞 北陸先端科学技術大学院大学 山形大学 東京工科大学 他関係各位、この場を借りてお礼を申し上げます。 林幸雄先生(多くの論文提供)
インターネット空間生態系アーキテクチャ 謝辞 北陸先端科学技術大学院大学 林幸雄先生(多くの論文提供) 松久保潤様(メトリックスの提案) 宮崎敏幸様(可視化ツール) 山形大学 横山拓哉様(カテゴリ情報入手・リンク関係判別ツール) 山脇淳様(既存ツールの提供) 東京工科大学 上林憲行先生(一年間の指導) 他関係各位、この場を借りてお礼を申し上げます。 東京工科大学 メディア学部 石村享久

26 参考文献 インターネット空間生態系アーキテクチャ 東京工科大学 メディア学部 石村享久
ミツエーリンクス社, “Web運用に活かせるマーケティングの法則”, 安藤昌也, “「誰もが幹事になれる!」地域コミュニティの活性化を目的とした「コミュニティウェア」開発の試み”, Albert-Laszlo Barabasi ,”新ネットワーク思考”, NHK出版, 2002 Steve Lawrence, C.Lee Giles, “Searching the World Wide Web”, Science, Vol. 280, No. 5360, pp , 1998 Mark S.Granovetter, “The Strength of Weak Ties”, American Journal of Sociology 78, 1973 Takeshi Yamada, Kazumi Saito, Naonori Ueda, “Cross-Entropy Directed Embedding of Network Date”, 2003 Vilfredo Pareto, Trattato di Sociolosia Generale,The Mind and Soziety, 1897 黄林春, 林幸雄, “リンク構造解析によるページの価値計算とネットワーク分析”, 1999 小島秀一, 高州淳宏, 安達淳, “Webページ群の構造解析とグループ化”, NII Journal No.4, 2002 AltaVista, IBM, Compaq, “Graph structure in the web”, The 9th International World Wiede Web Conference, 2000 相馬亘, 下原勝憲, “スモールワールドネットワークの役割”, 第二種研究会, 2001 上林憲行, “インターネット空間を包含した地域社会デザイン”, 情報メディア研究会, 2001 山脇淳, “地域におけるWEBサイト群の静的構造の解明”, 山形大学平成14年度卒業論文, 2003 Ulrik Brandes, “A Faster Algorithm for BetWeenness Centrality” Journal of Mathematical Sociology: , 2001 箕浦 正人, 林 幸雄, “さまざまなネットワークにおける除法伝播と構造の特徴”, 電気関係学会北陸支部連合大会講演論文集C-49, pp.185, 2002 松久保潤, 林幸雄, “地域コミュニティにおけるWebアクセスの可視化”, 電子情報通信学会総合大会, 2002 林幸雄, “成長するネットワークの生態学-その共通構造と伝播の平均場解析に関して-”, 情報論的学習理論ワークショップ, 2003 横山拓哉, 山脇淳, 上林憲行, 小山明夫, “地域情報空間におけるWEBサイト群の静的構造の解明”, 情報処理学会東北支部第4回研究会, 2002 石原元, “地域におけるインターネット動態特性をモニターする実験運用と分析に関する研究”, 山形大学工学部卒業論文, 2001 青木恭久, “地域におけるインターネット動態特性をモニターするオンライン定点観測網アーキテクチャの研究”, 山形大学大学院修士論文, 2000 総務省「通信白書」, NetRatings, 水野貴明, “自分でできるWEBアクセス解析とデータ活用術”, 日経BP企画, 2002 武井純孝, “役立つショートプログラムで学ぶJava”, セレンディップ, 2002 東京工科大学 メディア学部 石村享久


Download ppt "地域ウェブ空間における構造特性と抽出の研究:八王子周辺地域"

Similar presentations


Ads by Google