情報システム解析学科谷ゼミ田中健太森口麻里吉野友美

Slides:

Advertisements

Similar presentations

ゲームプログラミング講習第2章関数の使い方

Advertisements

サービス管理責任者等研修テキスト分野別講義　　　「アセスメントと　　　　　　　支援提供の基本姿勢」＜児童発達支援管理責任者＞平成２７年１０月１日.

ヒトの思考プロセスの解明を目的とするワーキングメモリの研究

第２７講オームの法則電気抵抗の役割について知るオームの法則を使えるようにする抵抗の温度変化を理解する教科書Ｐ．223～226

コラッツ予想の変形について東邦大学　理学部　情報科白柳研究室山中　陽子.

コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―

第5章家計に関する統計ｰ経済統計ｰ.

公共財公共経済論 II no.3 麻生良文.

VTX alignment D2 浅野秀光２０１１年１２月１５日　放射線研ミーティング.

冷却フランシウム原子を用いた電子の永久電気双極子能率探索のためのルビジウム磁力計の研究

生命情報学（８）スケールフリーネットワーク

前半戦「史上最強」風札上げクイズ.

認知症を理解し環境の重要性について考える

フッ化ナトリウムによる洗口２０１０・９・１３宮崎市郡東諸県郡薬剤師会学校薬剤師　　日高　華代子.

食品の安全性に関わる社会システム：総括健康弱者ハイリスク集団 HACCP （食肉処理場・食品工場）農場でのQAP 一般的衛生管理

規制改革とは？ ○規制改革の目的は、経済の活性化と雇用の創出によって、　活力ある経済社会の実現を図ることにあります。

地域保健対策検討会に関する私見（保健所のあり方）

公共政策大学院鈴木一人第8回　専門化する政治公共政策大学院鈴木一人

医薬品ネット販売規制について 2012年５月31日ケンコーコム株式会社.

平成２６年８月２７日（水）大阪府健康医療部薬務課医療機器グループ

平成26年度呼吸器学会からの提案結果（オレンジ色の部分が承認された提案）新規提案既収載の変更免疫組織化学染色、免疫細胞化学染色

エナジードリンクの危険性 2015年6月23日経営学部市場戦略学科MR３１９５稲沢珠依.

自動吸引は在宅を変えるか大分協和病院　院長　　　　　　　　山本　真.

毎月レポートビジネスの情報（2016年7月号）.

医療の歴史と将来医療と医薬品産業個人的経験 3. 「これからの医療を考える」（1）医薬品の研究開発－タクロリムスの歴史－

社会福祉調査論第4講２.社会調査の概要 11月２日.

2015年12月28日－2016年3月28日掲載分.

2010度民事訴訟法講義補論関西大学法学部教授栗田　隆.

腫瘍学概論埼玉医科大学国際医療センター包括的がんセンター緩和医療科/緩和ケアチーム奈良林至

“企業リスクへの考え方に変化を求められています。トータルなリスクマネジメント・サービスをプロデュースします。“

情報漏えい経済情報学科 E 　西村　諭 E 　釣　洋平.

金融班（ミクロ）.

第11回 2009年12月16日今日の資料＝A4・4枚＋解答用紙期末試験：2月3日（水）N2教室

【ＡＢＬ用語集】（あいうえお順） No 用語解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17

基礎理論(3) 情報の非対称性と逆選択公共政策論II No.3 麻生良文.

浜中健児昭和４２年３月２７日生まれ東京都在住株式会社ピー･アール･エフ代表取締役（学歴) 高校：千葉県立東葛飾高校卒業

COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED

Blosxom による CMS 構築と SEO テクニック

記入例 JAWS DAYS 2015 – JOB BOARD 会社名採用職種営業職／技術職／その他（）仕事内容待遇募集数

ネットビジネスの企業と特性 MR1127　まさ.

Future Technology活用による業務改革

ネットビジネス論（杉浦）第８回　ネットビジネスと情報技術.

g７４１００１長谷川嵩 g７４０７９６迫村光秋 g７４１０００西田健太郎 g７４１１４７小井出真聡

自然独占公共経済論 II no.5 麻生良文.

Autonomic Resource Provisioning for Cloud-Based Software

Webショップにおける webデザイン 12/6　08A1022 甲斐　広大.

物理的な位置情報を活用した仮想クラウドの構築

ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み

寺尾敦青山学院大学社会情報学部第12回　情報デザイン（４）情報の構造化と表現寺尾　敦青山学院大学社会情報学部

【１−１．開発計画 – 設計・開発計画】システム開発計画にはシステム開発を効率的、効果的に実行する根拠（人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等）を記述すること。システム開発の開始から終了までの全体スケジュールを記載すること。アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。

6　日本のコーポレート・ガバナンス 2008年度「企業論」川端　望.

急成長する中国ソフトウェア産業中国ソフトウェアと情報サービス産業の規模総売上高は5年間で約5.3倍の成長

米国ユタ州ＬＤＳ病院胸部心臓外科フェローの経験

公益社団法人日本青年会議所関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会

次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会明治大学駿河台校舎リバティタワー9階1096教室

子どもの本の情報大阪府内の協力書店の情報こちらをクリック大阪府内の公立図書館・図書室の情報

第2回産業調査小島浩道.

〈起点〉を示す格助詞「を」と「から」の選択について

広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について　　－日本語教育と中日カルチャーショックの観点から－名古屋大学杉村　泰.

■5Ahバッテリー使用報告事例紹介/東【その1】 ■iphon4S（晴れの昼間/AM8-PM3） ◆約1時間で68%⇒100％

『ワタシが!!』『地域の仲間で!!』市民が始める自然エネルギー!!

ポイントカードの未来形を形にした「MUJI Passport」

SAP NetWeaver を支える Microsoft テクノロジーの全貌（Appendix）

ガイダンス（内業）測量学実習　第1回.

Python超入門久保幹雄東京海洋大学.

熱力学の基礎丸山茂夫東京大学大学院工学系研究科機械工学専攻

京都民医連中央病院 CHDF学習推進委員会

資料２－④ ④下水道.

ＡｃｃｅｓｓによるＳＱＬの操作～実際にテーブルを操作してみよう！～.

Presentation transcript:

情報システム解析学科谷ゼミ 5405019 田中健太 5405078 森口麻里 5405081 吉野友美 Trial program for movie rating prediction using Collaborative Filtering 協調フィルタリングを用いた映画評価予測プログラムの試作情報システム解析学科谷ゼミ 5405019　田中健太 5405078　森口麻里 5405081　吉野友美

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

研究 Computational Advertising 趣味・嗜好・行動の中からそのユーザーに合った広告を表示する 1. はじめに研究 Computational Advertising 趣味・嗜好・行動の中からそのユーザーに合った広告を表示する

1. はじめに・実際にどんなところに使われているか

1. はじめに

・ユーザーに合った広告を表示できる →広告メディアとして有力・ビジネス的にも技術的にも興味深い分野 1. はじめに・ユーザーに合った　広告を表示できる　→広告メディアとして有力・ビジネス的にも　技術的にも興味深い分野広告媒体 1 TV 2 インターネット 3 新聞 4 ラジオ Yahoo!JAPAN 掲示板より

1. はじめにレコメンドシステムユーザーの趣味嗜好、購入履歴からそのユーザーがまだ購入、レンタルしたことがなく、そのユーザーが満足するであろう商品を推薦、提案しようというもの。

1. はじめに -米オンラインビデオレンタルの最大手 -賞金 $1,000,000 -レコメンドシステムの精度を10%改善する NetFlix 　-米オンラインビデオレンタルの最大手　-レコメンドシステムを使用 NetFlix Prize 　-2006/10/2 ～ 2011/10/2 　-賞金 $1,000,000 　-レコメンドシステムの精度を10%改善する　　アルゴリズムを公募

データセット 1. はじめにユーザー映画評価 NetFlix 480,000 20,000 100,000,000 MovieLens レコメンドシステムの技術 - コンテンツベース - ルールベース - 協調フィルタリング過去のユーザーの評価や行動履歴などを利用して推薦対象のユーザーの嗜好を推測するものである。データセットユーザー映画評価 NetFlix 480,000 20,000 100,000,000 MovieLens 943 1,682 100,000

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

2.1 User Base & Item Base 重要になっている考え推薦対象のユーザーと趣味嗜好が似ているユーザーが好むアイテムを推薦対象のユーザーも好むであろう趣味嗜好が似ていないユーザーが好まないアイテムを対象ユーザーが好むであろう

2.1 User Base & Item Base アイテム V W X Y Z A 2 5 B 1 C D 4 ユーザー

2.1 User Base & Item Base アイテム V W X Y Z A 2 5 B 1 C D 4 ユーザー

2.1 User Base & Item Base アイテム V W X Y Z A 2 5 B(似) 1 C(違) D(？) 4 ユーザー

2.1 User Base & Item Base アイテム V W X Y Z A 2 5 B 1 C D 4 ユーザー

2.1 User Base & Item Base 基本的な考えあるアイテムについて推薦対象のユーザーの予測評価値を他の類似したユーザーたちによる評価の加重平均を用いて計算一般に使われる類似度計算アルゴリズム・ピアソンの相関係数・ベクトル類似度・etc

2.1 User Base & Item Base 問題点データセットの密度が疎の場合 →精度が悪くなるスケーラビリティの問題 →データが大きくなると計算が困難コールドスタート問題 →過去のデータがない人には推薦不可能

2.1 User Base & Item Base ユーザーベースのアプローチ [Paul Resnick他,1994,CSCW] (1).推薦対象のユーザーと他のユーザー間の類似度を計算 (2).類似度とユーザーの評価でアイテムの予測評価値を計算アイテムベースのアプローチ [Badrul Sarwar他,2001,WWW10] (1).各アイテム間の類似度を計算 (2).推薦対象のユーザーが評価したアイテムとの類似度とその評価で予測評価値を計算参考資料 : 集合知プログラミング [Toby Segarn著,2008]他

2.1 User Base & Item Base アイテムの集合ユーザーの集合推薦対象ユーザー表記法の定義 I = {i1,i2,...,im} アイテムの集合 U = {u1,u2,...,un} ユーザーの集合 ua 推薦対象ユーザー Ru(i) ユーザーuのアイテムiに対する評価ユーザーuの平均評価 𝑅 𝑢

2.1 User Base & Item Base ～ユーザーベースの協調フィルタリング予測対象アイテムについて (1) ua と他のユーザーuとの類似度を計算 (2) 1.ua と各ユーザーuの類似度×uの評価値の総和を計算 2.総和を上で用いた類似度の絶対値の和で割る

2.1 User Base & Item Base ～ユーザーベースの協調フィルタリング (1) ua と他のユーザーu との類似度を計算する。今回はピアソンの相関係数を使用 sim 𝑢,𝑢′ = 𝑡∈𝐼 𝑢 ∧𝐼 𝑢′ 𝑅 𝑢 𝑖 − 𝑅 𝑢 ⋅ 𝑅 𝑢′ 𝑖 − 𝑅 𝑢′ 𝑡∈𝐼 𝑢 ∧𝐼 𝑢′ 𝑅 𝑢 𝑖 − 𝑅 𝑢 2 𝑡∈𝐼 𝑢 ∧𝐼 𝑢′ 𝑅 𝑢′ 𝑖 − 𝑅 𝑢′ 2

2.1 User Base & Item Base ～ユーザーベースの協調フィルタリング相関係数の値について相関係数の値の範囲は-1～1 -1に近い：趣味嗜好が似ていない 1に近い：趣味嗜好が似ている

2.1 User Base & Item Base ～ユーザーベースの協調フィルタリング相関係数を求めるには2人の共通したアイテムを用いる a b c d e f g h i j k ua 1 4 5 2 u 3 計算した値は信用できるのか？ →共通したアイテムが5未満の場合：相関係数を0 実験ではさらに相関係数が正の値のみを評価予測に使用する 2種類を使用

2.1 User Base & Item Base ～ユーザーベースの協調フィルタリング (2) 1.ua と各ユーザーuの類似度×uの評価値の総和を計算 2.総和を上で用いた類似度の絶対値の和で割る 𝑅 𝑢 𝑎 𝑖 = 𝑢∈𝑈 𝑖 sim 𝑢 𝑎 ,𝑢 ⋅ 𝑅 𝑢 𝑖 𝑢∈𝑈 𝑖 ∣ sim 𝑢 𝑎 ,𝑢 ∣

2.1 User Base & Item Base ～アイテムベースの協調フィルタリング予測対象アイテムについて (1) 各アイテムi 間の類似度を計算する (2) 1.ua の評価済みアイテムとの類似度 ×ua の評価済みアイテムの評価値の総和を計算 2.総和を上で用いた類似度の絶対値の和で割る

2.1 User Base & Item Base ～アイテムベースの協調フィルタリングユーザーベースの協調フィルタリングと同様にピアソンの相関係数を使用 sim 𝑖,𝑖′ = 𝑢∈𝑈 𝑖 ∧𝑈 𝑖′ 𝑅 𝑢 𝑖 − 𝑅 𝑢 ⋅ 𝑅 𝑢 𝑖′ − 𝑅 𝑢 𝑢∈𝑈 𝑖 ∧𝑈 𝑖′ 𝑅 𝑢 𝑖 − 𝑅 𝑢 2 𝑢∈𝑈 𝑖 ∧𝑈 𝑖′ 𝑅 𝑢 𝑖′ − 𝑅 𝑢 2

2.1 User Base & Item Base ～アイテムベースの協調フィルタリング (2) 1.ua の評価済みアイテムとの類似度 ×ua の評価済みアイテムの評価値の総和を計算 2.総和を上で用いた類似度の絶対値の和で割る 𝑅 𝑢 𝑎 𝑖 = 𝑖′∈𝐼 𝑢 𝑎 sim 𝑖,𝑖′ ⋅ 𝑅 𝑢 𝑎 𝑖′ 𝑖′∈𝐼 𝑢 𝑎 ∣ sim 𝑖,𝑖′ ∣

2.1 User Base & Item Base ～アイテムベースの協調フィルタリングキーとなる考え推薦対象ユーザーが好むジャンルのアイテムは評価が高くなる好まないジャンルのアイテムは評価が低くなる表記法の追加 G = {g1,g2,...,go} ジャンルの集合 G(i) アイテムiが属するジャンルの集合 GRu(i) アイテムiが属するジャンルに対するユーザーuの平均評価

ユーザーの平均評価×1.25以上 like ユーザーの平均評価×0.75以下 dislike それ以外 unknown 2.1 User Base & Item Base ～評価予測にユーザーのジャンルの好みを追加する like、dislikeの定義 GRu(i)の値がユーザーの平均評価×1.25以上 like ユーザーの平均評価×0.75以下 dislike それ以外 unknown

2.1 User Base & Item Base ～評価予測にユーザーのジャンルの好みを追加する先ほどのlike、dislike、unknownを用いるために予測値の計算の置き換え 𝑅 𝑢 𝑎 𝑖 = 𝑢∈𝑈 𝑖 sim 𝑢 𝑎 ,𝑢 ⋅ 𝑅 𝑢 𝑖 𝑢∈𝑈 𝑖 ∣ sim 𝑢 𝑎 ,𝑢 ∣ +𝜆 𝑅 𝑢 𝑎 𝑖 = 𝑖′∈𝐼 𝑢 𝑎 sim 𝑖,𝑖′ ⋅ 𝑅 𝑢 𝑎 𝑖′ 𝑖′∈𝐼 𝑢 𝑎 ∣ sim 𝑖,𝑖′ ∣ +𝜆

λについてlike、dislike、unknownによって値を変更 2.1 User Base & Item Base ～評価予測にユーザーのジャンルの好みを追加する λについてlike、dislike、unknownによって値を変更 μ = 0.1(10%) or 0.05(5%)

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　1.1 動機　　1.2 協調フィルタリングとは 2. 研究概要　　2.1 User Base & Item Base（予測にジャンルの好みを用いる）　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

Slope Oneアルゴリズム [D Lemire他, 2005, SIAM] 個々のユーザーのアイテム評価値間差分を算出し、全ユーザーについて算出されたアイテム評価値間差分の平均値を算出し、この算出結果を元にレコメンド結果を出す。ユーザ間の相関値を算出する必要がない。

X Y 太郎 2 3 花子 ? 2.2 Slope One 太郎のアイテム評価の差は 1 ⇒花子さんは Y を 4 と評価・簡単な例太郎のアイテム評価の差は　1　 ⇒花子さんは Y を　4　と評価　アイテム X Y 太郎 2 3 花子 ? ユーザー

X Y 一太郎 2 3 二太郎 5 三太郎 1 花子 ? 2.2 Slope One 一太郎の差は 1 二太郎の差は 3 アイテム X Y 一太郎 2 3 二太郎 5 三太郎 1 花子 ? 一太郎の差は　1 二太郎の差は　3 三太郎は　両方評価していないので無視 ⇒平均偏差　(1+3)/2 = 2 ⇒花子さんは　　　　Yを　5　と評価ユーザー

Uj,i：jとi を評価しているユーザーの集合 |A|：Aの総数 2.2 Slope One 𝑑𝑒𝑣 𝑗,𝑖 = 𝑢∈ 𝑈 𝑗,𝑖 𝑅 𝑢,𝑗 − 𝑅 𝑢,𝑖 ∣ 𝑈 𝑗,𝑖 ∣ i,j：アイテム(映画)　u：ユーザー Ru,i：u による i の評価 Uj,i：jとi を評価しているユーザーの集合 |A|：Aの総数

X Y Z 一太郎 2 3 1 二太郎 5 4 花子 ? 2.2 Slope One ⇒devZ,X = 0.5 アイテム X Y Z 一太郎 2 3 1 二太郎 5 4 花子 ? ユーザー ⇒devZ,X = 0.5 ⇒devZ,Y = (-2-1)/2 = -1.5 ⇒花子のCの評価は　(3+0.5)+(4-1.5)/2 = 3

i,j：アイテム(映画) u：ユーザー Ru,i,ui：u による i の評価 Ru：u が評価したアイテムの集合 |A|：Aの総数 2.2 Slope One 𝑃 𝑅 𝑢,𝑗 = 1 ∣ 𝑅 𝑢 ∣ 𝑖∈ 𝑅 𝑢 𝑑𝑒𝑣 𝑗,𝑖 + 𝑢 𝑖 i,j：アイテム(映画)　u：ユーザー Ru,i,ui：u による i の評価 Ru：u が評価したアイテムの集合 |A|：Aの総数

2.2 Slope One ～Weighted Slope-One 平均偏差について 1人の評価を元に出した値と 1000人の評価を元に出した値では重みが違う。 𝑃 𝑤 𝑅 𝑢,𝑗 = 𝑖∈ 𝑅 𝑢 𝑑𝑒𝑣 𝑗,𝑖 + 𝑢 𝑖 ∣ 𝑈 𝑖,𝑗 ∣ 𝑖∈ 𝑅 𝑢 ∣ 𝑈 𝑗,𝑖 ∣

2.2 Slope One ～Bi-polar Slope-One 好き嫌いに分けて予想する判定基準 × （評価は1~5なので）３・ユーザーの評価の平均 dislike ＜ aveu ＜ like 𝑃 𝑏𝑝 𝑅 𝑢,𝑗 = 𝑖∈ 𝑅 𝑢 𝑙𝑖𝑘𝑒 𝑑𝑒𝑣 𝑗,𝑖 𝑙𝑖𝑘𝑒 + 𝑢 𝑖 ∣ 𝑈 𝑖,𝑗 𝑙𝑖𝑘𝑒 ∣ + 𝑖∈ 𝑅 𝑢 𝑑𝑖𝑠𝑙𝑖𝑘𝑒 𝑑𝑒𝑣 𝑗,𝑖 𝑑𝑖𝑠𝑙𝑖𝑘𝑒 + 𝑢 𝑖 ∣ 𝑈 𝑖,𝑗 𝑑𝑖𝑠𝑙𝑖𝑘𝑒 ∣ 𝑖∈ 𝑅 𝑢 𝑙𝑖𝑘𝑒 ∣ 𝑈 𝑖,𝑗 𝑙𝑖𝑘𝑒 ∣ + 𝑖∈ 𝑅 𝑢 𝑑𝑖𝑠𝑙𝑖𝑘𝑒 ∣ 𝑈 𝑖,𝑗 𝑑𝑖𝑠𝑙𝑖𝑘𝑒 ∣

2.2 Slope One ～提案最低の重みは0 Weighted Slope Oneにおいて（誰にも評価されていないアイテムがある場合その予測値は0になる。）　→ 最低の重みを1にする（誰にも評価されていないアイテムを評価するときにはユーザーの平均を用いることが出来る）

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　1.1 動機　　1.2 協調フィルタリングとは 2. 研究概要　　2.1 User Base & Item Base（予測にジャンルの好みを用いる）　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

ユーザーのジャンル嗜好を求めて、同じ嗜好を持つユーザーの評価を参考に評価する 2.3 ジャンル嗜好ユーザーのジャンル嗜好を求めて、同じ嗜好を持つユーザーの評価を参考に評価するアクション映画最高！アニメ大好き！ですよね！

2.3 ジャンル嗜好基本手順１．それぞれのユーザーのジャンル平均を求める２．ジャンル平均を求めた上で、そのジャンルを好むか好まないか判断する３．その映画を好むグループと好まないグループに分けて、それぞれで平均をだす４．未評価の映画に対して、その映画を好むか好まないか判断し、評価する

2.3 ジャンル嗜好藤巻山崎戸張２５３４アクションアニメ１０５好む好まない５２４２．５藤巻山崎戸張 A ２５ B ３４アクションアニメ A １０ B ５好む好まない A ５２ B ４２．５藤巻山崎戸張アクション４３３．５ジャンル２

基本手順との変更点 (1)基本手順での評価結果にジャンル平均との平均を出す (2)好む、好まないの他に普通という基準と設ける 2.3 ジャンル嗜好基本手順との変更点 (1)基本手順での評価結果にジャンル平均との平均を出す (2)好む、好まないの他に普通という基準と設ける

(1)基本手順での評価結果にジャンル平均との平均を出す 2.3 ジャンル嗜好 (1)基本手順での評価結果にジャンル平均との平均を出す山崎藤巻戸張Ａ２５Ｂ４アクションアニメＡ１０Ｂ４．５好む好まないＡ５２Ｂ４山崎藤巻戸張アクション４３３．５アニメ２

(2)好む、好まないの他に普通という基準と設ける 2.3 ジャンル嗜好 (2)好む、好まないの他に普通という基準と設ける山崎藤巻戸張上村Ａ２３５Ｂ４１アクションアニメＡ１０Ｂ５山崎藤巻戸張上村アクション５２３アニメ４１好む普通好まない A ５３２ B ４．５１

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　1.1 動機　　1.2 協調フィルタリングとは 2. 研究概要　　2.1 User Base & Item Base（予測にジャンルの好みを用いる）　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

3. 実験方法実験環境データセットについて MovieLens(ミネソタ大学提供) 各ユーザー毎に評価数20は保証されている。 CPU Athlon64 3200+ メモリ 1024MB OS CentOS5.2 データセットについて MovieLens(ミネソタ大学提供) 　　各ユーザー毎に評価数20は保証されている。ユーザー数 943 映画数 1682 評価数 10万

分割学習法 3. 実験方法各ユーザー毎にランダムに10評価抜いたデータを予測対象データとし、残りを予測のためのデータとする。これを10組作成し実験を行い、精度を出し、その平均を比較する。

MAEの値が0に近ければ近いほど誤差が少なく、精度が良い。 3. 実験方法精度 → 今回は精度を比較するためにMAEを採用 MAE・・・Mean Absolute Error(平均絶対誤差) N：予測対象データ数=9430 MAEの値が0に近ければ近いほど誤差が少なく、精度が良い。

3. 実験方法～実験に使用したプログラム計19個(C++) ・ユーザーベース･アイテムベース･Slope One 3. 実験方法　～実験に使用したプログラム・ユーザーベース　+ジャンルの好みを用いる(0.1 or 0.05) ･アイテムベース上の6種類× 相関係数の全体を用いる(type A) or 正の値のみを用いる(type B) ･Slope One ･Weighted Slope One（重みを2通り）･bi-polar Slope One ･ジャンル嗜好（オリジナル）計19個(C++)

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　1.1 動機　　1.2 協調フィルタリングとは 2. 研究概要　　2.1 User Base & Item Base（予測にジャンルの好みを用いる）　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

・アイテムベースのほうが優秀・正の値のみを用いると、精度が上がる 4. 結果・考察　～既存アルゴリズム精度ユーザーベース(type A) 1.768743 (type B) 0.822609 アイテムベース(type A) 1.276004 0.842814 ・アイテムベースのほうが優秀・正の値のみを用いると、精度が上がる

・重みをかけたほうが精度が高い・bi-polarはより精度が高くなるとされているが、今回はデータ量が少なかったせいか精度が落ちている 4. 結果・考察　～既存アルゴリズム精度ユーザーベース(type A) 1.768743 (type B) 0.822609 アイテムベース(type A) 1.276004 0.842814 Slope One 0.763081 Weighted SO 0.762692 ・重みをかけたほうが精度が高い・bi-polarはより精度が高くなるとされているが、　今回はデータ量が少なかったせいか精度が落ちている

既存のものと比較して値がほとんど変化していない →unknownの幅を取りすぎたのではないか？ 4. 結果・考察　～オリジナル精度ユーザーベース(type A) 0.1 1.770090 (type A) 0.05 1.769306 アイテムベース(type A) 0.1 1.276039 1.275851 ユーザーベース(type B) 0.1 0.822413 (type B) 0.05 0.822261 アイテムベース(type B) 0.1 0.842043 0.842190 既存のものと比較して値がほとんど変化していない →unknownの幅を取りすぎたのではないか？

4. 結果・考察～オリジナル・多少だが精度は上がった。精度 Weighted SO 0.762692 Weighted SO(改) 4. 結果・考察　～オリジナル精度 Weighted SO 0.762692 Weighted SO(改) 0.761764 ・多少だが精度は上がった。

・基本手順と比較して、ジャンル平均を加えたものは僅かによくなった。・好む好まない普通の３タイプにわけたものは逆に悪くなった。 4. 結果・考察　～オリジナル精度ジャンル嗜好 0.861948 ジャンル嗜好２ 0.860496 ジャンル嗜好３ 1.200622 ・基本手順と比較して、ジャンル平均を加えたものは僅かによくなった。・好む好まない普通の３タイプにわけたものは逆に悪くなった。

目次 1. はじめに 2. 研究概要 2.1 User Base & Item Base（予測にジャンルの好みを用いる） 3. 実験方法　　1.1 動機　　1.2 協調フィルタリングとは 2. 研究概要　　2.1 User Base & Item Base（予測にジャンルの好みを用いる）　　2.2 Slope one 　　2.3 ジャンル嗜好（オリジナル） 3. 実験方法 4. 結果・考察 5. 今後の課題

[1] 別の手法を取り入れる -クラスタリング -特異値分解(SVD) [2] データベースの利用・マシンスペックの改善 5. 今後の課題 [1] 別の手法を取り入れる -クラスタリング -特異値分解(SVD) [2] データベースの利用・マシンスペックの改善ユーザー映画評価 NetFlix 480,000 20,000 100,000,000 MovieLens 943 1,682 100,000

fin