自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介
研究背景 特徴から自動車を検索できるものを作ることが出来ないのか 自動車レビューを基に検索サイトの作成 内輪健一、鈴木貴裕 (2009) 研究背景 特徴から自動車を検索できるものを作ることが出来ないのか 自動車レビューを基に検索サイトの作成 内輪健一、鈴木貴裕 (2009) 「自動車レビュー簡潔化の手法の提案」 卒業論文
研究目的 レビューサイトに投稿されたレビューから文を抽出し、自動車の特徴を分析 特徴を入力することで自動車を検索するシステムの構築
使用するレビューについて レビューの数が多い、レビューが内容別に書かれて いる 使用するレビューについて 本研究ではcarview(URL : http://www.carview.co.jp/)という自動車総合情報ウェブサイトにあるレビュー・評価を利用した レビューの数が多い、レビューが内容別に書かれて いる
Carviewのレビューページ 評価 なんでここまで売れてないのか?? もう少し売れてもおかしくない気がします。 満足している点 エクステリアデザイン。 普段使いでは十分なトルク。 不満な点 150キロあたりから若干フワつく。 アフターパーツが少ない。
システムの全体図
レビューの抽出について ・「トヨタ」「日産」「ホンダ」「マツダ」からそれぞれ10車種 ・2006年以降のレビュー ・グレードの区別なし
レビュー文の分析 本研究では特徴分析の際にKH-Coderを利用した。 KH-Coderによる特徴分析 レビュー文の分析 本研究では特徴分析の際にKH-Coderを利用した。 KH-Coder :テキストマイニング、特に 内容分析(計量テキスト分析)のためのフリーソフトウェア。 KH-Coderによる特徴分析 レビュー文の中から自動車の特徴となる単語を抜き出し、特徴リストを作成し、検索の材料としている。
分析結果(特徴リスト) 一車種につき、以下の条件で特徴を抽出 分析結果(特徴リスト) 一車種につき、以下の条件で特徴を抽出 個数は5個程度 出現割合が0.20%以上 特徴を表す語の中に類似した語がある場合、その中で出現頻度が高く、わかりやすい語に統一
特徴の分析 共起ネットワーク 共起ネットワーク 多次元尺度法 多次元尺度法 語と語の繋がりの関係性を表示 特徴の分析 共起ネットワーク 語と語の繋がりの関係性を表示 多次元尺度法 似たものは近くに、異なったものは遠くに配置 共起ネットワーク 多次元尺度法
ウェブページ
「デザイン」が特徴リストに含まれている車種がリストアップされる。 検索結果 「デザイン」が特徴リストに含まれている車種がリストアップされる。
特徴としてあげられた語と他の語の関係性を表示。 車種ページ 特徴としてあげられた語と他の語の関係性を表示。
レビュー (デザイン) エクステリアデザイン。ずいぶん洗練されている印象です。 近未来を感じさせるデザインで、欧州車に負けないボディサイズ。 レビュー (デザイン) エクステリアデザイン。ずいぶん洗練されている印象です。 近未来を感じさせるデザインで、欧州車に負けないボディサイズ。 外観デザインは斬新かつ流麗で非常に満足。
評価方法 作成したシステムをウェブで公開 情報理工学部の4年生の研究協力者10名 システムの評価基準として使いやすさ、見やすさ、機能性
評価内容 ホームページの見やすさ、使いやすさ 特徴での検索結果 レビューを使用した情報提示の仕方 実際に自動車を求める際に使用できるか 評価内容 ホームページの見やすさ、使いやすさ 特徴での検索結果 レビューを使用した情報提示の仕方 実際に自動車を求める際に使用できるか 使用した感想、改善点
良い評価 ウェブページも見やすく自動車の特徴もちゃんと分析できている。 良い評価 ウェブページも見やすく自動車の特徴もちゃんと分析できている。 自動車の特徴がグラフで見ることができ、様々な自動車の特徴をすぐ知ることができる。 自動車の特徴で検索が出来るということが便利だと思う。
悪い評価 自動車の数が少ないから、自分の調べたい自動車がない。 悪い評価 自動車の数が少ないから、自分の調べたい自動車がない。 キーワードの特徴は特徴なら何でも検索することができるのか。また、特徴の種類は何種類あるのか。 調べたい特徴が少ない。
評価のまとめ 自動車の特徴について知ることが簡単にできるという好評価とともに、情報量が少ないという問題点の指摘があった。
考察 情報量(メーカー、車種数)を増やすために自動でレビュー文を抽出し分析する機能を付け加えるという改善が必要。 考察 情報量(メーカー、車種数)を増やすために自動でレビュー文を抽出し分析する機能を付け加えるという改善が必要。 自動車の特徴を数値だけではなくグラフを用いたこと、レビューから情報を集めることで見えてきた特徴を生かした検索の仕方にするなど、他とは違ったものを作成出来た。
展望 情報量の問題、自動車の特徴とする単語を設定する上での基準の設定などの改善点がある。 展望 情報量の問題、自動車の特徴とする単語を設定する上での基準の設定などの改善点がある。 情報は常に更新されていくので如何にして今回、作成したシステムを自動で更新させていくのかというところが大きな課題の一つである。
先行研究について 内輪健一、鈴木貴裕 (2009) 「自動車レビュー簡潔化の手法の提案」 情報理工学部情報知能学科 内容 先行研究について 内輪健一、鈴木貴裕 (2009) 「自動車レビュー簡潔化の手法の提案」 情報理工学部情報知能学科 内容 サイトに投稿された評価、レビューの中から必要な情報だけを抜きだし、簡潔化して見やすい形に表示する。