自動車レビュー簡潔化の手法の提案 情報理工学部・情報知能学科 4年 H206010 内輪健一 H206036 鈴木貴裕.

Slides:



Advertisements
Similar presentations
卒業論文審査会 Web の読みやすさ実験ツールの開発 岩手県立大学 ソフトウェア情報学部 ソフトウェア情報学部 4 年 柴田 大樹 指導教員:鈴木克明 藤原康宏 市川尚.
Advertisements

電子書籍の検索機能の改善 木下研究室 201002713 鴫原 善寿. 背景 スマートフォンなどの携帯端末の普及と ともに電子書籍に注目が浴びた。中でも amazon の kindle など電子書籍の専用端末も 現れた。 電子書籍はデータなので本棚もいらず、 持ち運びも容易になるなど様々な恩恵を もたらした。
ハイブリット カー 1. ハイブリットカーの歴史 2. ハイブリットカーとは? 3. ハイブリットカーは安いのか 4. ハイブリットカーについての賛否 5. ハイブリットカーの課題 6. ハイブリットカー以外のエコカー 7. ハイブリットカーの未来.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
「わかりやすいパターン認識」 第1章:パターン認識とは
小樽観光アンケートの分析について まず、基本情報について
Takashi Taniguchi (谷口貴志)
ヘルスケア連動型 市販薬検索システム 研究者 : 加納 えり 指導教員 : 越田 高志.
Twitterの発言に基づくウェブページ推薦システム
プレゼンテーションの方法 浅川伸一
マジェスティ125の統一・改善の提案 経営学部 経営学科 古角 太朗.
Microsoft PowerPointを使ってみよう
圧縮類似度を用いた方言の自動分類 ~ライス符号を用いた前処理~ ~連結クラスタリング法~ ~余弦類似度を用いた方言分類木の評価~
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
歌詞による楽曲の印象分類 情報理工学部 情報知能学科 H207025 加藤 里奈.
ヒューマンインターフェース ~ウェブサイト評価~
第3章 第2節 ネットワークを活用した 情報の収集・発信 6 情報の多様な提示方法 7 構造を工夫した情報の表現方法 8 ウエブページの公開
4Y-4 印象に残りやすい日本語パスワードの合成法
手回し発電機に豆電球をつないで回してみます。どうなりますか?
経営学部 経営学科 ITビジネスコース 菊地真実子
形態素解析および係り受け解析・主語を判別
卒業研究 先輩の経験談に基づいた就職活動の目標管理方法
情報処理 第13回.
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
中間発表 アリの王国更新 金華山の写真整理 柏崎 奈々 中間発表を始めます。
<参考資料> 見やすいパワーポイントの作り方のポイント
小売店舗における陳列改善策の検討とVRの活用に関する研究
<参考資料> 文章の書き方 1)レポートの基本的構成 ①はじめに(ケースの全体像)・・・研究の動機 ②目的(研究の目的)
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
大規模アドホックネットワークにおける 階層的な名前解決法
練習問題アイテムバンクの開発研究 ~再生形式~
Android端末によるロボット制御とその評価
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
ハイブリッドカーは本当にエコなのか 経営学部市場戦略学科 MR8084 長谷川 裕太.
Javaクラスの利用関係を用いた ソフトウェア部品のカテゴリ階層構築法
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
環境リスクマネジメントに関する 検索システム
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
ベイズフィルタリングを用いた 口コミの分類 ―自分好みの店の抽出―
[アクセシビリティはユニバーサルデザインと支援技術の共同作業である] 石川准
構文解析を用いた文分類の手法 ー自動二輪に関する評価表現についてー
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
一人暮らしの男性のための料理検索システムの設計
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
ルーブリック・チャート(評価) の活用と課題
中京大学 情報理工学部 情報知能学科 H 中畑 淳貴 H 堀田 将克
日本の表音文字(ひらがな、かたかな)と漢字
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
舞台配置図をPowerPointで作るテンプレート
ブラウザを快適に操作するツールの開発 藤村研究室 1DS04179M 阪上 翔伍.
Javaソフトウェア部品検索システムSPARS-Jの実験的評価
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
パソコン.
プレゼンテーションの方法 浅川伸一
基礎技術ー3 : Webページの標準規格について
情報基礎Ⅱ (第1回) 月曜4限 担当:北川 晃.
構造的類似性を持つ半構造化文書における頻度分析
データマイニングアルゴリズム「アプリオリ」と「ID3」の比較
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
自然言語処理2015 Natural Language Processing 2015
情報処理 第13回.
第1章 現状メソッドの標準化 対象工程を流れる代表品種に対し作業を区分し、時間・頻度を 明らかにして、オペレーションリストを作成する。
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
駒澤大学 経営学部経営学科 MG8007 市川 綾由美 西村ゼミ課題 駒澤大学 経営学部経営学科 MG8007 市川 綾由美.
情報ネットワークと コミュニケーション 数学領域3回 山本・野地.
ディーゼルエンジンについて 尾崎文香 基礎セミナー発表.
識別子の読解を目的とした名詞辞書の作成方法の一試案
アルゴリズム ~すべてのプログラムの基礎~.
Presentation transcript:

自動車レビュー簡潔化の手法の提案 情報理工学部・情報知能学科 4年 H206010 内輪健一 H206036 鈴木貴裕

研究背景 近年レビューサイトの利用者が増え、レビューの数が膨大になっており、レビューすべてを見て評価の内容を把握することが非常に困難である。 横川くんの研究はバイクのレビューをもとにしていますが、自分たちは自動車のレビューをもとにしています。 自動車のレビューはバイクのレビューとは違い、レビュー数が多いため、この研究ではまとめるということを目的としています。

carviewのフィットのレビュー このレビューは自動車のレビューですが、このレビューだけで900件ほどあり、 このように、その物に対する評価が書き込まれています

研究目的 複数あるレビューを簡潔な形にすること ひとつひとつのレビューでは整理されていますが、 レビューすべてを見ようとするときに、全体を把握するのは困難なため、レビューを簡潔な形にすることにしました。

理想形 1つのページに情報が集約されている 実現するために レビューをカテゴリに分類する (カテゴリはレビューされている物の特徴) レビュー中にどのような意見が多いか見られるようにする 簡潔な形はどのようなものか考えたときに、 1つのページに情報が集約されており、かつ見る情報が少ないものが簡潔な形と言えるのではないかと考えています。

システムの全体図 実現するために、このような流れでシステムを組みました。 まずレビューサイトからレビューを抽出します。 レビュー文をもとに辞書を作成し、その辞書をもとに文を分類します。 分類した文の中からいくつかの文を選び、ウェブ上に公開するという流れです。

利用するレビューの種類 自動車レビュー 特徴を比較的とらえやすい 生活に身近なため利用者が多い 利用するレビューですが、特徴を比較的とらえやすいことと、 生活に身近なため利用者が多いという点から自動車のレビューを選んでいます。

利用するサイトについて carviewという自動車サイトのユーザーレポートを利用する (http://www.carview.co.jp/userreport/) 主な理由    ・比較的レビュー数が多い  ・満足点と不満点が別々に書かれており、これらの判断をするシステム      を作らなくてよい プリウス フィット シビック carview 377 925 424 価格.com 105 149 Yahoo!自動車 657 673 93 自動車のレビューサイトもいくつかあると思いますが、レビューの比較的多いサイトを利用しています。 プリウスが若干劣っていますが、総合的に見てレビュー数の多いcarviewというサイトを利用します。

carviewのプリウスのレビュー

レビューを簡潔化するために 複数あるレビューから特徴的な文をまとめる 二人別々にアプローチを考案 整理されていない状態から、何かを元にして文をまとめればいいのではないかと考えた。

2つのアプローチについて 単語からのアプローチ 係り受けからのアプローチ 人が車を評価する上で使われる単語で文を分類 ・レビューに存在する頻出語から、車に関係するものを選出する ・選出した語をもとにして文章を分類する 係り受けからのアプローチ レビュー中に多く出現する意見をもとに文を分類 ・レビューに存在する文法的に係り合った語と語の頻度を出す ・頻度が高いものが含まれている文を選出する 単語からのアプローチでは、人が車を語る上で使う単語で文を分類すれば、まとまるのではないかという考えから 係り受けからのアプローチでは、レビュー中にどういう意見が多く存在するかが分かればまとまるのではないかという考えから

単語からのアプローチ(1) 10車種の頻出単語を出力する ミニバン、軽自動車、スポーツカー、コンパクトカー、ハイブリットカー それぞれのジャンルでレビュー数が多いものから2車種ずつ

単語からのアプローチ(2) 頻出単語を走行性能、内装、外装という3つのカテゴリに分類する 各カテゴリに含まれる単語に基づいて、文を小分類する 燃費 走行 加速 運転 エンジン ハンドル パワー モーター アシスト ブレーキ 視界 室内 席 内装 シート 装備 インテリア メータ オーディオ エアコン トランク 外装 剛性 オープン ボディ デザイン リア 幅 塗装 頻出単語を走行性能、内装、外装という3つのカテゴリに分類する 各カテゴリに含まれる単語に基づいて、文を小分類する

プリウス満足点

係り受けからのアプローチ(1) CaboCha(係り受け解析器)を用いてレビュー中の係り受けの頻度を求める。 単語は名詞・形容詞・副詞のみを使用する   プリウスにおいて

係り受けからのアプローチ(2) 「燃費-良い」のような主語+述語のものとは違い、「静粛-性」のような複合語の場合はそれ自身が良いのか悪いのか分からない。 そのためさらに係り受けを調べ、人手で作成した良い表現と悪い表現の辞書にマッチしたもののみ頻度を求めた。 ポジティブ ネガティブ 良い   十分 最高   快適 嬉しい  安定 抜群   便利 満足   素晴らしい 顔負け 好み   悪い   しんどい がさつ  酷い 不満   不評 嫌い   不快 最悪   貧相 狭い   安っぽい 良い頻度表を作るために

プリウス満足点

ウェブ公開 第1版 単語からのアプローチ 文章を圧縮のみでいいと思って

係り受けからのアプローチ

評価方法 研究協力者10人にウェブページを見てもらう 2つのアプローチの比較 2つのウェブページの改良点 どちらが見やすいか どちらが使いやすいか 2つのウェブページの改良点

評価結果 単語からのアプローチ7人 係り受けからのアプローチ3人

具体的な感想 単語からのアプローチ 係り受けからのアプローチ 「項目ごとにまとまっていて見やすい」、「情報量が多くて良い」    「項目ごとにまとまっていて見やすい」、「情報量が多くて良い」    「文の量が多くてわかりにくい」、「ぱっと見てわかりにくい」 係り受けからのアプローチ    「ポイントで見たい時に見られる」、「文をあまり読む必要がない」    「係りと頻度でまとめると使いにくい」、「細かく切りすぎて見にくい」

考察 なぜ単語からのアプローチが多かったか 視覚的な部分に対する評価が多い 文のみの圧縮だけでは簡潔化に限界がある カテゴリに分けられており、視覚的に見やすかった 視覚的な部分に対する評価が多い 文のみの圧縮だけでは簡潔化に限界がある

改善案 グラフを入れることで視覚的に把握できるようにする 通常の状態では文を隠すようにしておく   http://www.st.chukyo-u.ac.jp/h206036/top.html 「ぱっと見てわかりにくい」という意見をもとに、グラフを入れることで視覚的に把握できるようにする 「文の量が多くてわかりにくい」という意見をもとに、Javaスクリプトを使い、クリックすると文が出現するようにする

修正後の考察  理想形に近づいたか 1つのページに情報が集約されている グラフを使うことで見る情報量が減った

展望 二つのアプローチの統合 すべて自動化 評価点数のグラフ化 様々なレビューに応用 ポジティブネガティブの判別    ポジティブネガティブの判別 Carviewにはユーザーが点数をつけるところがあり、それをグラフ化することでも簡潔化になると考える。 平均点数は乗っているが、何点が何人とかはのっていないので、それをグラフにする。 横川くんが行っていた、ポジティブネガティブの判別を組み込む