初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座 2002年5月28日 政策科学部助手 山田 一隆
練習問題(相関) 再購入 あり なし 書き やすさ よい 10 4 わるい 5 21 再購入 あり なし デザ イン よい 8 10 わるい (1)-1 筆記具の「書きやすさ」と「デザイン」のよしあしと再購入の有無の関係. 再購入 あり なし 書き やすさ よい 10 4 わるい 5 21 再購入 あり なし デザ イン よい 8 10 わるい 7 15 「カテゴリデータ」と「カテゴリデータ」の相関係数=「クラメールの独立係数」. 公式:
練習問題(相関) サンプル数(n)と小さいほうのカテゴリー数(k)がわかっている. χ2(カイ2乗)を求める. 再購入 あり なし 計 書きやすさ よい 10 4 14 わるい 5 21 26 15 25 40 サンプル数(n)と小さいほうのカテゴリー数(k)がわかっている. χ2(カイ2乗)を求める. 実測度数(xij),期待度数(xp(ij))とすると,xp,χ2は,
練習問題(相関) 期待度数(xp)を求めましょう. 再購入 あり なし 計 書きやすさ よい xp(11)=15×14÷40 =5.25 =8.75 14 わるい xp(21)=15×26÷40 =9.75 xp(22)=25×26÷40 =16.25 26 15 25 40
練習問題(相関) 期待度数(xp)を求めましょう. 再購入 あり なし 計 書きやすさ よい xp(11)=15×14÷40 =5.25 =8.75 14 わるい xp(21)=15×26÷40 =9.75 xp(22)=25×26÷40 =16.25 26 15 25 40
練習問題(相関) ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が求められます. やや弱い相関がある ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が求められます. やや弱い相関がある 同様にして,「デザイン」と「再購入」の相関の度合い「クラメールの独立係数」は,以下のようになります.
練習問題(相関) ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が求められます. やや弱い相関がある ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が求められます. やや弱い相関がある 同様にして,「デザイン」と「再購入」の相関の度合い「クラメールの独立係数」は,以下のようになります.
練習問題(相関) ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が求められます. やや弱い相関がある ようやく,「書きやすさ」と「再購入」の相関の度合い「クラメールの独立係数」が求められます. やや弱い相関がある 同様にして,「デザイン」と「再購入」の相関の度合い「クラメールの独立係数」は,以下のようになります. 相関がない
練習問題(検定) (2)-1 各年の母集団の認知率とその差の検定. 母比率の推定とその差の検定. 99年 00年 01年 n 96 120 105 % 18% 21% 23% 公式: に,上表の各年次の値を代入します.
練習問題(検定) 99年: 10.4-25.6% 00年: 13.7-28.3% 01年: 15.0-31.0%
練習問題(検定) 各年次の母比率の推定結果を数直線上に表現してみます. 99年: 10.4% 25.6% 00年: 13.7% 28.3% 99年: 10.4% 25.6% 00年: 13.7% 28.3% 01年: 15.0% 31.0% 上図のように,母比率に差がない. つまり,経年的に認知率が高まっているとはいえない.
練習問題(検定) 各年次の母比率の推定結果を数直線上に表現してみます. 実際の母比率は, こんな増加傾向かもしれないし...... 99年: 99年: 10.4% 25.6% 00年: 13.7% 28.3% 01年: 15.0% 31.0% 上図のように,母比率に差がない. つまり,経年的に認知率が高まっているとはいえない.
練習問題(検定) 各年次の母比率の推定結果を数直線上に表現してみます. 実際の母比率は, こんな減少傾向かもしれないし...... 99年: 99年: 10.4% 25.6% 00年: 13.7% 28.3% 01年: 15.0% 31.0% 上図のように,母比率に差がない. つまり,経年的に認知率が高まっているとはいえない.
練習問題(検定) (2)-3 以下のようなアンケート調査を行いました. 問1:商品Aはおいしかったですか. (2)-3 以下のようなアンケート調査を行いました. 問1:商品Aはおいしかったですか. 1.かなりおいしい 2.少しおいしい 3.どちらともいえない 4.少しまずい 5.かなりまずい 問2:商品Bはおいしかったですか. 問3:あなたの性別は? 1.男性 2.女性 a.このとき,AとBの商品に対する評価には差がありますか. b.このとき,Aに対する評価に,男女間では差がありますか.
練習問題(検定) (2)-3 以下のようなアンケート調査を行いました. 問1:商品Aはおいしかったですか. (2)-3 以下のようなアンケート調査を行いました. 問1:商品Aはおいしかったですか. 1.かなりおいしい 2.少しおいしい 3.どちらともいえない 4.少しまずい 5.かなりまずい 問2:商品Bはおいしかったですか. 問3:あなたの性別は? 1.男性 2.女性 a.このとき,AとBの商品に対する評価には差がありますか. b.このとき,Aに対する評価に,男女間では差がありますか. 対応のある場合の母平均の差の検定 対応のない場合の母平均の差の検定
回帰分析 独立変数 従属変数 多重共線性
回帰分析 単回帰分析 独立変数が1つの場合. y=ax+b 重回帰分析 独立変数が2つ以上の場合. y=a1x1+a2x2+a3x3+…+b
多変量解析と数量化理論 多変量解析 数量化理論 2変数(あるいは3変数)以上のデータの関係性をみる. わが国では,数量化理論も多変量解析のうちとみなされている. 数量化理論 カテゴリーデータ間の関係をみることができる. 林知己夫(統計数理研究所)が開発した,わが国独特の手法で,国際的には認められていない.
多変量解析と数量化理論 数量データ カテゴリデータ 従属変数(外的基準)がある 予測 重回帰分析 数量化理論Ⅰ類 判別 重判別分析 (予測と判別) 予測 (従属変数が数量) 重回帰分析 数量化理論Ⅰ類 判別 (従属変数がカテゴリ) 重判別分析 数量化理論Ⅱ類 従属変数(外的基準)がない (内的構造分析) 分類を目的 間接的 多次元尺度構成法 数量化理論Ⅲ類 (カテゴリを空間に配置) 数量化理論Ⅳ類 (アイテムを空間に配置) 直接的 クラスター分析 変数の合成 主成分分析 潜在因子の発見 因子分析
多変量解析と数量化理論 数量化理論Ⅲ類とⅣ類の違い Ⅲ類:変数の値(カテゴリ)を最少次元数の空間に布置する. 問:あなたの「生きがい」は何ですか. 1.仕事 2.趣味 3.配偶者 4.子 5.孫 6.カネ 空間にプロットされるのは,「仕事」,「趣味」......
多変量解析と数量化理論 数量化理論Ⅲ類とⅣ類の違い Ⅳ類:変数(アイテム)を最少次元数の空間に布置する. 問:商品Aはおいしかったと思いますか. 1.とても思う 2.まあまあ思う 3.どちらともいえない 4.あまり思わない 5.まったく思わない 空間にプロットされるのは,「商品Aはおいしい」.