決定木-III Occam’s razor(オッカムの剃刀) Minimum Description Length (最小記述長) 枝刈り 事例に適合する仮説のうち, 最も単純なものを優先する Minimum Description Length (最小記述長) モデルの複雑さ+モデルでの学習事例の複雑さ (木のノード数) (学習事例に対する誤差) 枝刈り 枝刈り基準 枝刈り対象ノードの順番 アルゴリズム 枝刈りの回数 今回のデモ ○データ:Car ○基準:利得比 ○グラフ:Mode ●検証 ○データ1-13を学習 データ14-26を検証 認識率=1/13 ○データ14-26を削除 ○N-交差検証法,N=1 削除順13, 12, 11, …,1 認識率=3/13 ●なぜシンプル方がいい? データ14-26を検証 ○ノイズ注入:データ1と2のクラスラベルをいじる ●枝狩りの効果 ○上記のノイズ注入データを使用 ○枝狩り基準 price (1/13)/1 *safety-L (1/13)/2, maincost-R (1/13)/1 maincost (2/13)/3, *safety-R(1/13)/2 person (5/13)/6 ↑1st safeyを枝狩り maincost (2/13)/1 person (5/13)/2 ↑2st maincostを枝狩り ●枝狩りを何回やればいい?
応用例 研究目的 宝探し(クエスト)のゲームにおいて 生理情報 経過時間 移動履歴 達成意欲 合計203の属性から 宝探し(クエスト)のゲームにおいて 生理情報 経過時間 移動履歴 達成意欲 合計203の属性から 心拍数の変化(UP か DOWN) 皮膚電動の変化 (UP か DOWN) を予測
ROC曲線 受信者動作特性曲線 (Receiver Operating Characteristic Curve) True Positive Rate VS False Positive Rate True Positive Rate(陽性率) 「 + 」と判断された「+」事例数 「+」の事例数 False Positive Rate(擬陽性率) 「 + 」と判断された「-」事例数 「-」の事例数