データマイニングって何だろう? 新美研究室 m1203129 大都宣弥
データが少ない場合 データが少ないと、傾向や特性がわかる。 例:大学生の手足のサイズ 身長 右手 左手 靴 167.6 19.1 18.6 データが少ないと、傾向や特性がわかる。 例:大学生の手足のサイズ 身長 右手 左手 靴 167.6 19.1 18.6 25.5 170.4 18.4 17.2 172.6 18 17.5 26 180.1 20.6 20.4 27.5 170.9 16.2 15.9 27 169.8 16.9 16 167.9 18.8 164.3 17 17.1 24.5 169.7 16.6 17.3 177.3 17.6 17.4
でもデータが整理されていないと データが多かったり、データが不揃いだと上手く解析できません。
それを解決するために データマイニングが使われます。 データマイニングとは簡単に言うと、 そのデータに適した解析方法を利用して、データから新しい知識を発見する手法です。
全体の流れ
知識を得るためには まずデータを集めることが大切です。 でもデータがあるだけではだめで、それを解析しやすい形にしなくてはなりません。 そのために前処理が必要です。
それから データを使いやすい形にしてから、マイニングします。 マイニング方法は色々ありますが今回は省略、興味を持ったら是非調べてください。
おまけ 私は卒業研究としてデータマイニングを用いて、クレジットカードの不正検出用モデル作成を行っています。 具体的な研究内容はデータマイニングの前処理に当たるサンプリングです。