タレントの魅力測定とその分析
評定の概要 8人のアイドル・タレントを、右の評定用フォームを用い、評定した。評定項目は、 「かわいい」、「美しい」、「セクシー」、「おもしろい」の4つを用い、「全く当てはまらない」から「非常にあてはまる」の5段階スケールとした。 http://kodamalab.sakura.ne.jp/nagano/PIP1/question1.php
評定結果データのダウンロード FireFoxを使って、http://kodamalab.sakura.ne.jp/nagano/PIP1/にアクセスし、alldata.csv をデスクトップに保存する。 ダウロードマネージャが出るので、デスクトップにドラッグアンドドロップする。
alldata.csv をダブルクリックすると、以下のようなデータになっている。
Ctrl+Aで全データを選択したら、データタブ→並べ替え→優先されるキーを性別に設定し、OKを押そう。
データが男女別に並べ替えられる。 このデータは、女性28名、男性13名ぶん、8人のタレント×4質問=計32項目のデータであることがわかる。 (Q1:かわいい、Q2:美しい、Q3:セクシー、Q4:おもしろい)
各タレントのレーダーチャート(全体) タレント0 タレント1 タレント2 タレント3 タレント4 タレント5 タレント6 タレント7
各タレントのレーダーチャート(男女別) タレント0 タレント1 タレント2 タレント3 タレント4 タレント5 タレント6 タレント7
項目別各タレントの評定値 かわいい 美しい セクシー おもしろい
平均評定値を用いた散布図 タレント別各項目の平均評定値 相関係数:0.78 相関係数:0.81 かわいい 美しい セクシー おもしろい 相関係数:-0.37 相関係数:0.81 相関係数:-0.13 相関係数:0.78 相関係数:0.93 相関係数:-0.10 平均評定値を用いた散布図 タレント別各項目の平均評定値
タレント0 タレント1 タレント2 タレント3 タレント4 タレント5 タレント6 タレント7 かわいい 美しい セクシー おもしろい
エクセルデータをSASへインポートし分析する
t検定用のデータを作成する 1.エクセルのワークシートから、データ部分だけを選択しコピーする。 ← 2.TeraPadに貼り付け、ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、data.txtという名前で保存する。
対応のないt検定(男女で評定結果を比較) /*データの読み込み*/ options ls=80; data nagano; infile 'data.txt' dlm='09'x; input subject $ sex $ q01-q04 q11-q14 q21-q24 q31-q34 q41-q44 q51-q54 q61-q64 q71-q74; /*データのソート*/ proc sort; by sex; /*対応のないt検定 タレント1でかわいさに男女差はあるか?*/ proc ttest; class sex; var q11; /*対応のないt検定 タレント1で美しさに男女差はあるか?*/ var q12; /*対応のないt検定 タレント1でセクシーさに男女差はあるか?*/ var q13; /*対応のないt検定 タレント1で面白さに男女差はあるか?*/ var q14; run; ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、 akbT1.sasという名前で保存する。 タレント1に関し、男女で評価が分かれそうなのは、どの項目か?
q11:タレント1のかわいさ q12:タレント1の美しさ SAS システム 1 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q11 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.5385 1.1983 0.3323 1.0000 4.0000 ア・ 28 3.5714 1.3452 0.2542 1.0000 5.0000 Diff (1-2) -1.0330 1.3018 0.4369 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.5385 1.8143 3.2626 1.1983 ア・ 3.5714 3.0498 4.0930 1.3452 Diff (1-2) Pooled -1.0330 -1.9167 -0.1493 1.3018 Diff (1-2) Satterthwaite -1.0330 -1.8928 -0.1732 95% 標準偏差の信頼 sex 手法 限界 m 0.8593 1.9781 ア・ 1.0635 1.8310 Diff (1-2) Pooled 1.0663 1.6715 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -2.36 0.0231 Satterthwaite Unequal 26.169 -2.47 0.0204 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 27 12 1.26 0.6933 SAS システム 2 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q12 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.3846 1.4456 0.4009 1.0000 5.0000 ア・ 28 2.8571 1.0440 0.1973 1.0000 4.0000 Diff (1-2) -0.4725 1.1822 0.3968 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.3846 1.5111 3.2582 1.4456 ア・ 2.8571 2.4523 3.2620 1.0440 Diff (1-2) Pooled -0.4725 -1.2751 0.3300 1.1822 Diff (1-2) Satterthwaite -0.4725 -1.4112 0.4661 95% 標準偏差の信頼 sex 手法 限界 m 1.0366 2.3863 ア・ 0.8254 1.4210 Diff (1-2) Pooled 0.9684 1.5180 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -1.19 0.2409 Satterthwaite Unequal 18.045 -1.06 0.3043 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 12 27 1.92 0.1564 タレント1に関して、男女のかわいさ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=2.36, p<.05となり、5%水準で有意な差がみとめられた。 したがって、タレント1のかわいさ評定値は、女性において有意に高い事がわかった。 タレント1に関して、男女の美しさ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=1.19, n.s.となり、有意な差はみとめられなかった。 したがって、タレント1の美しさ評定値には男女で差がないことがわかった。
q13:タレント1のセクシーさ q14:タレント1の面白さ SAS システム 3 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q13 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.2308 1.1658 0.3233 1.0000 5.0000 ア・ 28 2.9643 1.3189 0.2492 1.0000 5.0000 Diff (1-2) -0.7335 1.2737 0.4275 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.2308 1.5263 2.9352 1.1658 ア・ 2.9643 2.4529 3.4757 1.3189 Diff (1-2) Pooled -0.7335 -1.5982 0.1311 1.2737 Diff (1-2) Satterthwaite -0.7335 -1.5721 0.1051 95% 標準偏差の信頼 sex 手法 限界 m 0.8359 1.9243 ア・ 1.0427 1.7952 Diff (1-2) Pooled 1.0434 1.6355 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -1.72 0.0941 Satterthwaite Unequal 26.362 -1.80 0.0838 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 27 12 1.28 0.6711 SAS システム 4 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q14 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.6154 0.9608 0.2665 1.0000 4.0000 ア・ 28 3.0000 1.2172 0.2300 1.0000 5.0000 Diff (1-2) -0.3846 1.1444 0.3841 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.6154 2.0348 3.1960 0.9608 ア・ 3.0000 2.5280 3.4720 1.2172 Diff (1-2) Pooled -0.3846 -1.1615 0.3923 1.1444 Diff (1-2) Satterthwaite -0.3846 -1.1042 0.3350 95% 標準偏差の信頼 sex 手法 限界 m 0.6890 1.5860 ア・ 0.9623 1.6567 Diff (1-2) Pooled 0.9375 1.4695 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -1.00 0.3228 Satterthwaite Unequal 29.313 -1.09 0.2835 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 27 12 1.60 0.3917 タレント1に関して、男女のセクシーさ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=1.72, n.s.となり、有意な差はみとめられなかった。 したがって、タレント1のセクシーさ評定値には男女で差がないことがわかった。 タレント1に関して、男女の面白さ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=1.00, n.s.となり、有意な差はみとめられなかった。 したがって、タレント1の面白さ評定値には男女で差がないことがわかった。
対応のあるt検定(タレントごとに評定値を比較) /*データの読み込み*/ options ls=80; data nagano; infile 'data.txt' dlm='09'x; input subject $ sex $ q01-q04 q11-q14 q21-q24 q31-q34 q41-q44 q51-q54 q61-q64 q71-q74; /*対応のあるt検定 タレント6と7でかわいさに差はあるか?*/ proc ttest; paired q61*q71; /*対応のあるt検定 タレント5と7でかわいさに差はあるか?*/ paired q51*q71; /*対応のあるt検定 タレント0と1で面白さに差はあるか?*/ paired q04*q14; /*対応のあるt検定 タレント1と4で面白さに差はあるか?*/ paired q14*q44; run; ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、 akbT2.sasという名前で保存する。 かわいさ おもしろさ 自分で比較したい部分を選定し、プログラムを作成する!
q61-q71:タレント6-7間でかわいさ比較 q51-q71:タレント5-7間でかわいさ比較 かわいさ SAS システム 1 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q61 - q71 N 平均 標準偏差 標準誤差 最小値 最大値 41 -1.0732 1.1487 0.1794 -3.0000 2.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -1.0732 -1.4357 -0.7106 1.1487 0.9431 1.4698 自由度 t 値 Pr > |t| 40 -5.98 <.0001 SAS システム 2 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q51 - q71 N 平均 標準偏差 標準誤差 最小値 最大値 41 -0.3171 1.2337 0.1927 -3.0000 3.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -0.3171 -0.7065 0.0723 1.2337 1.0129 1.5785 自由度 t 値 Pr > |t| 40 -1.65 0.1077 かいわいさ評定値に関して、タレント6とタレント7の間に差があるかを対応のあるt検定により検討したところ、t(40)=5.98, p<.01となり、1%水準で有意な差がみとめられた。 したがって、タレント7のかわいさ評定値が、タレント6のかわいさ評定値に比べ有意に高いことがわかった。 かいわいさ評定値に関して、タレント5とタレント7の間に差があるかを対応のあるt検定により検討したところ、t(40)=1.65, n.s.となり、有意な差がみとめられなかった。 したがって、タレント5とタレント7のかわいさ評定値には差がないことがわかった。 かわいさ グラフと統計処理結果が対応しているか確認!
q04-q14:タレント0-1間で面白さ比較 q14-q44:タレント1-4間で面白さ比較 おもしろさ SAS システム 3 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q04 - q14 N 平均 標準偏差 標準誤差 最小値 最大値 41 -1.1951 1.2494 0.1951 -4.0000 2.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -1.1951 -1.5895 -0.8008 1.2494 1.0258 1.5986 自由度 t 値 Pr > |t| 40 -6.13 <.0001 SAS システム 4 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q14 - q44 N 平均 標準偏差 標準誤差 最小値 最大値 41 -0.1220 0.8716 0.1361 -2.0000 2.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -0.1220 -0.3971 0.1532 0.8716 0.7156 1.1153 自由度 t 値 Pr > |t| 40 -0.90 0.3757 面白さ評定値に関して、タレント0とタレント1の間に差があるかを対応のあるt検定により検討したところ、t(40)=6.13, p<.01となり、1%水準で有意な差がみとめられた。 したがって、タレント1の面白さ評定値が、タレント0の面白さ評定値に比べ有意に高いことがわかった。 面白さ評定値に関して、タレント1とタレント4の間に差があるかを対応のあるt検定により検討したところ、t(40)=0.90, n.s.となり、有意な差がみとめられなかった。 したがって、タレント1とタレント4の面白さ評定値には差がないことがわかった。 おもしろさ グラフと統計処理結果が対応しているか確認!
相関係数計算用のデータを作成する 1.エクセルのワークシートから、 データ部分だけを選択しコピーする。 ← 2.TeraPadに貼り付け、 ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、data2.txtという名前で保存する。
各評定平均値どうしの相関を求める ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 /*データの読み込み*/ options ls=80; data nagano; infile 'data2.txt' dlm='09'x; input subject $ kawaii utukushii sexy omoshiroi; /*総当りで相関を計算する*/ proc corr; var kawaii utukushii sexy omoshiroi; run; ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、 akbCORR.sasという名前で保存する。
相関係数の計算結果 散布図と相関係数の対応を確認せよ! SAS システム 1 2012年12月17日 月曜日 午後01時55分16秒 CORR プロシジャ 4 変数 : kawaii utukushii sexy omoshiroi 要約統計量 変数 N 平均 標準偏差 合計 最小値 最大値 kawaii 8 2.89250 0.42250 23.14000 2.34000 3.46000 utukushii 8 2.50375 0.60469 20.03000 1.80000 3.41000 sexy 8 2.29875 0.55109 18.39000 1.61000 3.20000 omoshiroi 8 2.37750 0.54917 19.02000 1.68000 3.05000 Pearson の相関係数, N = 8 H0: Rho=0 に対する Prob > |r| kawaii utukushii sexy omoshiroi kawaii 1.00000 0.81432 0.78181 -0.37031 0.0139 0.0219 0.3665 utukushii 0.81432 1.00000 0.92929 -0.13199 0.0139 0.0008 0.7554 sexy 0.78181 0.92929 1.00000 -0.10343 0.0219 0.0008 0.8074 omoshiroi -0.37031 -0.13199 -0.10343 1.00000 0.3665 0.7554 0.8074 かわいい 美しい セクシー おもしろい 相関係数:-0.37 相関係数:0.81 相関係数:-0.13 相関係数:0.78 相関係数:0.93 相関係数:-0.10 かわいい、美しい、セクシー、面白いの4つの評定平均値に関し、相関係数を算出した。その結果、 かわいいと美しいの間に、5%水準で有意な正の相関(r=0.81)が、 かわいいとセクシーの間に、5%水準で有意な正の相関(r=0.78)が、 美しいとセクシーの間に、1%水準で有意な正の相関(r=0.93)が、 見られた。その他の評定値の間には、有意な相関関係はみられなかった。 したがって、かわいい、美しい、セクシーの各評定値は密接に関係しており、特に評定者は美しさとセクシー差を、ほとんど同じようにとらえている事がわかった。 散布図と相関係数の対応を確認せよ!