Presentation is loading. Please wait.

Presentation is loading. Please wait.

Webリンク構造を用いた 観光情報分析 北海道工業大学 電気工学専攻 齋藤翔太.

Similar presentations


Presentation on theme: "Webリンク構造を用いた 観光情報分析 北海道工業大学 電気工学専攻 齋藤翔太."— Presentation transcript:

1 Webリンク構造を用いた 観光情報分析 北海道工業大学 電気工学専攻 齋藤翔太

2 研究背景 インターネット上での観光情報発信が活発となっている. この情報を有効活用するための試みが行われている.
北海道観光の分析を,Webリンク構造に着目して行なう. インターネット上の北海道観光情報の発信状況について調査. 観光サイトの発見・収集の可能性の検討を行なった.

3 研究背景 Webマイニング データマイニングをWeb上の情報に適用 Web利用マイニング Webサーバに対するアクセスパターンの発見
ハイパーテキストのリンク構造パターンの発見

4 分析方法 定義 北海道市町村の集合 市町村自治体URLの集合 ※2005年7月現在のTmax=207 キーワード

5 市町村名とURL 207市町村全てが,Webサイトを開設している. ti (市町村名) si (市町村URL) 札幌市
小樽市 函館市 旭川市 喜茂別町 登別市 虻田町 上川町 釧路市 207市町村全てが,Webサイトを開設している.

6 分析方法 キーワードSWをサーチエンジンに入力した結果の取得 L(SW) l1 キーワードSW l2 l3 l4 l5 l6
※ i の値は,結果順位の値とする. l1 l2 l3 l4 l5 l6 L(SW) キーワードSW

7 分析方法 liにリンクしているURL(入次)集合を取得 liに含まれるURL(出次)集合を取得 IL(li) OL(li) li

8 実験 207市町村(2005年7月現在)全てを対象として,以下の実験を行なった. サーチエンジンには,Livedoorウェブサーチを用いた.
実験1 各北海道市町村名とキーワードから抽出されたURLについて重複数の調査 実験2 観光入込数と市町村自治体サイトへの入次数との関係について調査 サーチエンジンには,Livedoorウェブサーチを用いた.

9 実験1 キーワードSWは,ti+”観光” サーチエンジンにSWを入力し,L(SW)を取得 全検索結果から,重複URLを抽出
調査日 2005年7月 2005年12月 2006年2月

10 実験1結果 ページ別(2005年7月) ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値) 重複 順位
重複URLとページタイトル 重複数 <平均順位> 1 道内観光案内窓口一覧(株式会社イー・シー) 153(73.9%) <49.7> 2 お宿と観光旅館ホテル(ばっちり!北海道) 108(52.2%) <92.9> 3 観光協会(旅ページ) 99(47.8%) <79.6> 4 各地のお問い合わせ先(はなたび北海道) 92(44.4%) <105.1> 北海道地図と距離計算(北海道たび救援隊) <70.4> 6 組合・地域の紹介・観光情報(アイヌの生活と現在を考える窓) 83(40.1%) <93.3> 7 全国自治体ホームページ<北海道>(日経消費産業研究所) 75(36.2%) <123.3> 8 北海道観光情報(ソフトコンピューティング研究室) 71(34.3%) <142.0> 9 北から南から/北海道の観光旅行ガイド(ワン・トゥ・ワントラベル) 69(33.3%) <142.8> 北海道夏季観光バス道路図(社団法人 北海道観光バス協会) <120.1> 重複 順位 重複URLとページタイトル 重複数 <平均順位> 11 北海道の経済産業(北海道のホームページ) 65(31.4%) <100.8> 12 Travel & Sightseeing 59(28.5%) <111.4> 13 LookSmartカテゴリ検索 57(27.5%) <129.3> 北海道の観光(リンクのadjump) <108.9> 15 道北の不動産・住宅情報(賃貸博士) 45(21.7%) <127.7> 16 北海道観光情報(居酒屋うぇいぶ) 42(20.3%) <154.4> JTB北海道旅館ホテル連盟 <41.6> 18 北海道 観光局・観光協会(タウンネット) 41(19.8%) <86.7> 個人情報に関する苦情窓口 <163.8> 20 北海道役所リンク集(HIR-NET) 40(19.3%) <91.5> ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値)

11 実験1結果 ページ別(2005年12月) ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値) 重複 順位
重複URLとページタイトル 重複数 <平均順位> 1 (1) 道内観光案内窓口一覧(株式会社イー・シー) 167(80.7%) <52.7> 2 (2) お宿と観光旅館ホテル(ばっちり!北海道) 120(58.0%) <63.9> 3 (7) 全国自治体ホームページ<北海道>(日経消費産業研究所) 95(47.3%) <110.9> 4 (4) 北海道地図と距離計算(北海道たび救援隊) 85(41.1%) <115.3> 6 (6) 組合・地域の紹介・観光情報(アイヌの生活と現在を考える窓) 82(39.6%) <93.6> (-) ほっかいどう体験型観光ガイド 78(37.7%) <141.9> (11) 603-sangyo/sangyo.htm 北海道の産業観光 <98.8> 8 (18) 個人に関する苦情相談窓口 77(37.2%) <141.8> (3) [旅ページ]観光協会 <95.3> 10 (9) 北海道夏季観光バス道路図(社団法人 北海道観光バス協会) 76(36.7%) <111.3> 重複 順位 重複URLとページタイトル 重複数 <平均順位> 11 (4985) 各地のキャッチコピー(観光旅行は北海道っしょ) 72(34.8%) <130.6> (1550) 北海道の観光協会(日本列島お国自慢) <44.5> 13 (4) 各地のお問い合わせ先(はなたび北海道) 64(31.0%) <121.2> 14 (12) Travel & Sightseeing 62(29.5%) <101.7> 15 (4891) ぽめ太郎「北の温泉・観光街」 60(29.0%) <72.0> 16 (-) 観光アンケート調査(登別市) 58(28.0%) <127.7> 17 (31) 4travel 格安航空券 55(26.6%) <144.4> 北海道アート社 取引先一覧 54(26.1%) <125.1> 18 (388) 北から南から/北海道の観光旅行ガイド(ワン・トゥ・ワントラベル) 51(24.6%) <150.0> 19 (56) 北海道地域情報マガジン ウィンズ 48(23.2%) <148.7> 20 (16) JTB北海道旅館ホテル連盟 47(22.7%) <61.9> ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値)

12 実験1結果 ページ別(2006年2月) ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値) 重複 順位
重複URLとページタイトル 重複数 <平均順位> 1 (1) 道内観光案内窓口一覧(株式会社イー・シー) 167(80.7%) <52.7> 2 (2) お宿と観光旅館ホテル(ばっちり!北海道) 112(54.1%) <87.6> 3 (3) 全国自治体ホームページ<北海道>(日経消費産業研究所) 98(47.3%) <110.2> 4 (4707) PREF_CD=01&ADDR_NAME=北海道 おおいた・ゆふいん観光マップ 掲示板(北海道) 87(42.0%) <119.0> 5 (5) 組合・地域の紹介・観光情報(アイヌの生活と現在を考える窓) 85(41.1%) <93.7> 6 (6) 603-sangyo/sangyo.htm 北海道の産業観光 78(37.7%) <96.6> 7 (11) 各地のキャッチコピー(観光旅行は北海道っしょ) 77(37.2%) <130.7> 8 ほっかいどう体験型観光ガイド 75(36.2%) <141.1> 9 (10) 北海道夏季観光バス道路図(社団法人 北海道観光バス協会) 74(35.7%) <108.3> 重複 順位 重複URLとページタイトル 重複数 <平均順位> 10 (18) 個人に関する苦情相談窓口 72(34.8%) <138.3> (4) 北海道地図と距離計算(北海道たび救援隊) <112.0> 12 (4707) 4travel 格安航空券 68(32.9%) <131.9> 13 (11) 北海道の観光協会(日本列島お国自慢) 67(32.4%) <42.9> 14 (16) 観光アンケート調査(登別市) 66(31.9%) <128.1> 15 (17) 北海道アート社 取引先一覧 62(30.0%) <114.1> 16 (13) 各地のお問い合わせ先(はなたび北海道) 58(28.0%) <112.4> 17 (15) ぽめ太郎「北の温泉・観光街」 56(27.1%) <71.4> 18 北から南から/北海道の観光旅行ガイド(ワン・トゥ・ワントラベル) 55(26.8%) <148.5> 19 北海道旅行に役立つ上富良野町ガイド 53(25.6%) <138.0> 20 (-) リンク集(地域情報:北海道) 全国旅そうだん(日本観光) 51(24.6%) <106.7> ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値)

13 実験1結果 ホスト別(2005年7月) http://www.rurubu.com/ るるぶ.com http://4travel.jp/
重複 順位 重複URLとページタイトル 重複数 <平均順位> 1 るるぶ.com 191(92.3%) <62.7> 2 旅行のクチコミサイト フォートラベル 190(91.8%) <36.1> 3 北海道のホームページ 180(86.9%) <98.5> 4 国内旅行観光情報・大好き日本 175(84.5%) <72.3> 5 パラダイス北海道 174(84.1%) <79.4> 6 ウィキペディア 171(82.6%) <84.7> 7 JTBホームページ 169(81.6%) <80.0> 北海道ぐるり旅 168(81.2%) <77.6> 9 全国旅SODAN 166(80.2%) <76.7> 10 http;//phonebook.yahoo.co.jp/ Yahoo!電話帳 重複 順位 重複URLとページタイトル 重複数 <平均順位> 11 http;// Yahoo!ジオシティーズ 164(79.2%) <103.3> 12 Yahoo!カテゴリ(タイトル名なし) 163(78.7%) <103.9> 13 じゃらんnet 161(77.8%) <45.7> 14 CISNet Homepage 160(77.3%) <71.9> 15 Hokkaido Infomation Web Site 153(73.9%) <49.7> 16 北海道観光大全 152(73.4%) <90.5> 17 ASAHIネット 150(72.5%) <98.1> 18 Yahoo!地域情報 145(70.0%) <77.3> 19 hamanasu.or.jp/ はまなす財団 142(68.6%) <107.3> 20 http;// 地域情報マガジン「WINDS」 141(68.1%) <79.6> BIGLOBEホームページ広場 <69.9> ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値)

14 実験1結果 ホスト別(2005年12月) http://4travel.jp/ http://www.pref.hokkaido.jp/
重複 順位 重複URLとページタイトル 重複数 <平均順位> 1 (2) 旅行のクチコミサイト フォートラベル 193(93.2%) <46.3> 2 (7) 北海道ぐるり旅 190(91.8%) <67..4> 3 (6) ウィキペディア 189(91.3%) <61.3> 4 (1) るるぶ.com 185(89.3%) <63.2> 5 (13) じゃらんnet 183(88.4%) <46.2> 6 (4) 国内旅行観光情報・大好き日本 174(84.1%) <77.3> 7 (11) http;// Yahoo!ジオシティーズ 171(82.6%) <110.9> 8 (9) 全国旅SODAN <142.0> 9 (5) パラダイス北海道 170(82.1%) <70.7> 10 JTBホームページ 169(81.6%) <85.8> 重複 順位 重複URLとページタイトル 重複数 <平均順位> 11 (3) 北海道のホームページ 166(78.3%) <52.7> 12 (15) Hokkaido Infomation Web Site 162(78.3%) (1335) 日本列島お国自慢 <79.7> 14 (14) CISNet Homepage 160(77.3%) <68.0> 15 (35) 北海道人 154(74.4%) <66.5> 16 (17) ASAHIネット 146(70.5%) <95.0> 17 (10) Yahoo!電話帳 144(69.6%) <87.1> (22) 北海道日刊スポーツ 19 (20) http;// 地域情報マガジン「WINDS」 137(66.2%) <82.4> 20 (16) 北海道観光大全 135(65.2%) <96.3> ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値)

15 実験1結果 ホスト別(2006年2月) http;//www.geocities.jp/ Yahoo!ジオシティーズ
重複 順位 重複URLとページタイトル 重複数 <平均順位> 1 (1) 旅行のクチコミサイト フォートラベル 197(95.2%) <46.3> 2 (3) ウィキペディア 193(93.2%) <57.8> 3 (5) じゃらんnet 189(91.3%) <38.4> 4 (2) 北海道ぐるり旅 186(65.5%) <65.5> 5 (4) るるぶ.com 179(86.5%) <77.6> 6 (6) 国内旅行観光情報・大好き日本 167(80.7%) <83.9> 7 (15) 北海道人 165(79.7%) 8 (9) パラダイス北海道 154(74.4%) <88.1> 9 (10) JTBホームページ 154(35.7%) <108.3> 10 (18) 北海道のホームページ 152(73.4%) <99.9> (12) Hokkaido Infomation Web Site 150(72.5%) <57.3> 12 日本列島お国自慢 150(72.95) <79.3> 重複 順位 重複URLとページタイトル 重複数 <平均順位> 13 (6) http;// Yahoo!ジオシティーズ 147(71.0%) <119.3> 14 (14) CISNet Homepage 143(69.1%) <70.9> 15 (17) http;//phonebook.yahoo.co.jp/ Yahoo!電話帳 139(67.1%) <65.5> 16 北海道日刊スポーツ 135(65.2%) <88.4> 17 (16) ASAHIネット 134(64.7%) <98.4> 18 (27) Yahoo!地域情報 127(61.4%) <72.2> 19 (20) 北海道観光大全 122(58.9%) <97.9> 20 (21) 北海道発 YOMIURI ONLINE 117(56.5%) <92.9> (7) 全国旅SODAN <95.2> (19) http;// 地域情報マガジン「WINDS」 <86.0> ※重複数の%はカバー率 (重複数をTmax(= 207)で割った値)

16 実験1 SW=“北海道”+”観光” によるキーワードサーチで,上位に出現するサイト 313(151.2%) 79.2 0(0%) -
URLとタイトル 入次数検索の結果(2005年7月) 重複数(カバー率(%) 平均順位 北海道ぐるり旅 313(151.2%) 79.2 北海道観光総合データファイル 0(0%) - 旅!北海道 140(67.6%) 61.5 北海道観光情報 do なび 4(1.9%) 77.5 北の道再発見 28(13.5%) 128.0 チャンネル北海道 9(4.3%) 119.2 北海道人 158(76.3%) 95.4 トラベルイモーション 149(72.0%) 71.5 おみやげ北海道 35(16.9%)

17 実験1 考察 ページ単位では,自治体・観光サイトへのリンクを集めたページが多く出現する傾向にある.
ホスト単位では,自治体・観光サイトが多く出現する. “北海道 観光”をキーワードとした結果とは異なる

18 実験2 各自治体サイト si に対しての入次 IL(si) を取得 観光入込数とIL(si)との関係を調査
入次は,リンクページサーチ機能による結果を用いた 「link: si 」 をキーワードとして入力する 例(札幌市) link: siにリンクされているページが検索結果となる 入込総数は,北海道経済部による平成16年度の調査を基にした

19 実験2の結果(1) 札幌市(http://web.city.sappro.jp/) 1341万人 1680
市町村名とURL 入込総数 IL(Si)入次数 札幌市( 1341万人 1680 小樽市( 754万人 264 函館市( 507万人 276 旭川市( 426万人 312 喜茂別町( 328万人 54 登別市( 319万人 90 虻田町( 318万人 上川町( 255万人 88 釧路市( 192 帯広市( 239万人 868 七飯町( 214万人 20 白老町( 203万人 77 富良野市( 70 千歳市( 188万人 371 壮瞥町( 183万人 93 網走市( 182万人 105 斜里町( 158万人 50 阿寒町( 156万人 62 夕張市( 152万人 35 ※入込総数は,北海道経済部による平成16年度の調査を基にした

20 実験2の結果(2)2005年7月 全市町村 札幌市が他市町村から大きく離れている 入込数,入次数ともに「市」が高い値を示す傾向にある 札幌市
小樽市 函館市 帯広市 旭川市 千歳市 札幌市が他市町村から大きく離れている 入込数,入次数ともに「市」が高い値を示す傾向にある

21 実験2 カテゴリでの考察(市) 2005年7月 市カテゴリ 札幌市 小樽市 函館市 旭川市 帯広市 登別市 千歳市 釧路市

22 実験2 カテゴリでの考察(村) 2005年7月 村カテゴリ 留寿都村 大滝村 占冠村 洞爺村 厚田村 中札内村

23 実験2 カテゴリでの考察(圏域) 2005年7月 道央圏域 道南圏域 道北圏域 十勝圏域 オホーツク圏域 釧路・根室圏域
入込数最大値 16000 入次数最大値 ※圏域分類は,北海道経済部調査「平成16年度 北海道観光入込数調査書」による

24 実験2 カテゴリでの考察(道央) 2005年7月 道央圏域 札幌市 小樽市 千歳市 喜茂別町 登別市 虻田町

25 実験2 カテゴリでの考察(道南) 2005年7月 道南圏域 函館市 七飯町 長万部町 森町 上磯町

26 実験2 カテゴリでの考察(道北)2005年7月 道北圏域 旭川市 上川町 富良野市 稚内市 美瑛町 中富良野町 東川町

27 実験2 カテゴリでの考察(十勝) 2005年7月 十勝圏域 帯広市 新得町 足寄町 音更町

28 実験2 カテゴリでの考察(オホーツク) 2005年7月 オホーツク圏域 網走市 斜里町 美幌町 留辺蕊町 紋別市 小清水町 北見市

29 実験2 カテゴリでの考察(釧路・根室) 2005年7月 釧路・根室圏域 釧路市 阿寒町 弟子屈町 厚岸町 根室市

30 実験2 考察 観光入込数と自治体サイトへのリンク数は比例していない 入込数が少なくとも,インターネット上で注目されている市町村がある

31 まとめ インターネット上における北海道観光情報の発信状況についてWebリンク構造利用の観点から調査した. 今後の課題
ページ内容の形態素分析等を含めた調査

32 Webリンク構造を用いた 観光情報分析 北海道工業大学 電気工学専攻 齋藤翔太


Download ppt "Webリンク構造を用いた 観光情報分析 北海道工業大学 電気工学専攻 齋藤翔太."

Similar presentations


Ads by Google