タレントの魅力測定とその分析.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
EXCEL 講習会 2014 年 5 月 1 日,2 日 OSIPP NWC ① 11 : 00 ~ 12 : 00 ② 13 : 00 ~ 14 : 00 1 政策データ分析.
Windows 環境から SAS を使う 長野 祐一郎 1. データのダウンロード 2. データの加工 3. プログラムの作成 4.TeraTerm によるプログラムの実行 5. 処理結果の確認 6.SAS のデータ処理を概観 今回の授業では、 Windows 環境で作成されたデータを.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
Rコマンダーで反復測定ANOVA.
統計解析 第3章 散布度.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
SDOPxls2xml操作説明書 version1.0
データ分析入門(12) 第12章 単回帰分析 廣野元久.
数理統計学(第十回) ノンパラ検定とは?1 浜田知久馬 数理統計学第10回.
Rコマンダーで2要因の 反復測定ANOVA 「理学療法」Vol28(8)のデータ
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
第4章 MIXED Model 4.1 MIXED Model とは 4.2 反復測定データの分析1 分割法タイプのデータ
分散分析マスターへの道.
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
相関係数 植物生態学研究室木村 一也.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
データ分析2 1.平均値の比較のタイプ 2.対応のあるt検定 3.対応のないt検定 4.3つの以上のグループの差を調べる 5.参考文献
1.ダウンロードした波浪データをエクセルに読み込み、エクセル形式で保存。
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
第13回授業(7/10-1) での学習内容 6月19日に宿題にした平均値の差の検定結果、及び7月3日の授業で実習した同検定結果のウェブ上での検算のやり方を学習する。 この検算の宿題は、春期定期試験の時に、今日渡す2枚目の出欠表の裏に授業中の手計算による結果と比較して、手計算の結果が正しかったかを報告する。
応用言語学研究論A:SPSS宿題 Spring 2016 R.Nishida, Ph.D..
回帰分析.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
対応のあるデータの時のt検定 重さの測定値(g) 例:
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
Webで恋愛の類型を測り集計しレポートにまとめる
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
第3回(10/9)授業の学習目標 先輩の卒論調査への協力 第5章平均値の差の検定、のWEB宿題のやり方 第6章相関係数とその検定:
プログラミング入門2 総合演習課題 2008年 1/7, 1/21 実施 これまでの講義内容についての腕試し
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
相関分析.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
Rコマンダーで分割プロットANOVA 「理学療法」Vol28(8)のデータ
Rコマンダーで2元配置ANOVA 「理学療法」Vol28(8)のデータ
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
測定したデータの平均値を計算してグラフを描こう
秋期 第1回(9/25)授業の目標 授業五か条の再確認をする。 秋期の心理統計学の学習内容を知る。 2、3の注意事項を確認する。
第14回(1/15)授業の学習目標 第5章平均値の差の検定、のWEB宿題のやり方 秋期試験の内容について.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
母音[i]のF1, F2平均値の分析.
統計処理2  t検定・分散分析.
母分散の信頼区間 F分布 母分散の比の信頼区間
データベースの作り方  リサーチカンファレンス.
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
統計現象 高嶋 隆一 6/26/2019.
野中良哲 講義ページ : 情報処理1~第四回~ 野中良哲 講義ページ :
Presentation transcript:

タレントの魅力測定とその分析

評定の概要 8人のアイドル・タレントを、右の評定用フォームを用い、評定した。評定項目は、 「かわいい」、「美しい」、「セクシー」、「おもしろい」の4つを用い、「全く当てはまらない」から「非常にあてはまる」の5段階スケールとした。 http://kodamalab.sakura.ne.jp/nagano/PIP1/question1.php

評定結果データのダウンロード FireFoxを使って、http://kodamalab.sakura.ne.jp/nagano/PIP1/にアクセスし、alldata.csv をデスクトップに保存する。 ダウロードマネージャが出るので、デスクトップにドラッグアンドドロップする。

alldata.csv をダブルクリックすると、以下のようなデータになっている。

Ctrl+Aで全データを選択したら、データタブ→並べ替え→優先されるキーを性別に設定し、OKを押そう。

データが男女別に並べ替えられる。 このデータは、女性28名、男性13名ぶん、8人のタレント×4質問=計32項目のデータであることがわかる。                                 (Q1:かわいい、Q2:美しい、Q3:セクシー、Q4:おもしろい)

各タレントのレーダーチャート(全体) タレント0 タレント1 タレント2 タレント3 タレント4 タレント5 タレント6 タレント7

各タレントのレーダーチャート(男女別) タレント0 タレント1 タレント2 タレント3 タレント4 タレント5 タレント6 タレント7

項目別各タレントの評定値 かわいい 美しい セクシー おもしろい

平均評定値を用いた散布図 タレント別各項目の平均評定値 相関係数:0.78 相関係数:0.81 かわいい 美しい セクシー おもしろい 相関係数:-0.37  相関係数:0.81  相関係数:-0.13  相関係数:0.78  相関係数:0.93  相関係数:-0.10  平均評定値を用いた散布図 タレント別各項目の平均評定値

タレント0 タレント1 タレント2 タレント3 タレント4 タレント5 タレント6 タレント7 かわいい 美しい セクシー おもしろい

エクセルデータをSASへインポートし分析する

t検定用のデータを作成する 1.エクセルのワークシートから、データ部分だけを選択しコピーする。 ← 2.TeraPadに貼り付け、ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、data.txtという名前で保存する。

対応のないt検定(男女で評定結果を比較) /*データの読み込み*/ options ls=80; data nagano; infile 'data.txt' dlm='09'x; input subject $ sex $ q01-q04 q11-q14 q21-q24 q31-q34 q41-q44 q51-q54 q61-q64 q71-q74; /*データのソート*/ proc sort; by sex; /*対応のないt検定 タレント1でかわいさに男女差はあるか?*/ proc ttest; class sex; var q11; /*対応のないt検定 タレント1で美しさに男女差はあるか?*/ var q12; /*対応のないt検定 タレント1でセクシーさに男女差はあるか?*/ var q13; /*対応のないt検定 タレント1で面白さに男女差はあるか?*/ var q14; run; ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、 akbT1.sasという名前で保存する。 タレント1に関し、男女で評価が分かれそうなのは、どの項目か?

q11:タレント1のかわいさ q12:タレント1の美しさ SAS システム 1 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q11 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.5385 1.1983 0.3323 1.0000 4.0000 ア・ 28 3.5714 1.3452 0.2542 1.0000 5.0000 Diff (1-2) -1.0330 1.3018 0.4369 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.5385 1.8143 3.2626 1.1983 ア・ 3.5714 3.0498 4.0930 1.3452 Diff (1-2) Pooled -1.0330 -1.9167 -0.1493 1.3018 Diff (1-2) Satterthwaite -1.0330 -1.8928 -0.1732 95% 標準偏差の信頼 sex 手法 限界 m 0.8593 1.9781 ア・ 1.0635 1.8310 Diff (1-2) Pooled 1.0663 1.6715 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -2.36 0.0231 Satterthwaite Unequal 26.169 -2.47 0.0204 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 27 12 1.26 0.6933 SAS システム 2 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q12 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.3846 1.4456 0.4009 1.0000 5.0000 ア・ 28 2.8571 1.0440 0.1973 1.0000 4.0000 Diff (1-2) -0.4725 1.1822 0.3968 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.3846 1.5111 3.2582 1.4456 ア・ 2.8571 2.4523 3.2620 1.0440 Diff (1-2) Pooled -0.4725 -1.2751 0.3300 1.1822 Diff (1-2) Satterthwaite -0.4725 -1.4112 0.4661 95% 標準偏差の信頼 sex 手法 限界 m 1.0366 2.3863 ア・ 0.8254 1.4210 Diff (1-2) Pooled 0.9684 1.5180 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -1.19 0.2409 Satterthwaite Unequal 18.045 -1.06 0.3043 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 12 27 1.92 0.1564  タレント1に関して、男女のかわいさ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=2.36, p<.05となり、5%水準で有意な差がみとめられた。  したがって、タレント1のかわいさ評定値は、女性において有意に高い事がわかった。  タレント1に関して、男女の美しさ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=1.19, n.s.となり、有意な差はみとめられなかった。  したがって、タレント1の美しさ評定値には男女で差がないことがわかった。

q13:タレント1のセクシーさ q14:タレント1の面白さ SAS システム 3 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q13 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.2308 1.1658 0.3233 1.0000 5.0000 ア・ 28 2.9643 1.3189 0.2492 1.0000 5.0000 Diff (1-2) -0.7335 1.2737 0.4275 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.2308 1.5263 2.9352 1.1658 ア・ 2.9643 2.4529 3.4757 1.3189 Diff (1-2) Pooled -0.7335 -1.5982 0.1311 1.2737 Diff (1-2) Satterthwaite -0.7335 -1.5721 0.1051 95% 標準偏差の信頼 sex 手法 限界 m 0.8359 1.9243 ア・ 1.0427 1.7952 Diff (1-2) Pooled 1.0434 1.6355 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -1.72 0.0941 Satterthwaite Unequal 26.362 -1.80 0.0838 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 27 12 1.28 0.6711 SAS システム 4 2012年12月11日 火曜日 午後03時20分36秒 TTEST プロシジャ 変数: q14 sex N 平均 標準偏差 標準誤差 最小値 最大値 m 13 2.6154 0.9608 0.2665 1.0000 4.0000 ア・ 28 3.0000 1.2172 0.2300 1.0000 5.0000 Diff (1-2) -0.3846 1.1444 0.3841 95% 平均の信頼限 sex 手法 平均 界 標準偏差 m 2.6154 2.0348 3.1960 0.9608 ア・ 3.0000 2.5280 3.4720 1.2172 Diff (1-2) Pooled -0.3846 -1.1615 0.3923 1.1444 Diff (1-2) Satterthwaite -0.3846 -1.1042 0.3350 95% 標準偏差の信頼 sex 手法 限界 m 0.6890 1.5860 ア・ 0.9623 1.6567 Diff (1-2) Pooled 0.9375 1.4695 Diff (1-2) Satterthwaite 手法 分散 自由度 t 値 Pr > |t| Pooled Equal 39 -1.00 0.3228 Satterthwaite Unequal 29.313 -1.09 0.2835 等分散性 手法 分子の自由度 分母の自由度 F 値 Pr > F Folded F 27 12 1.60 0.3917  タレント1に関して、男女のセクシーさ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=1.72, n.s.となり、有意な差はみとめられなかった。  したがって、タレント1のセクシーさ評定値には男女で差がないことがわかった。  タレント1に関して、男女の面白さ評定値に差があるかを、対応のないt検定を用い検討したところ、t(39)=1.00, n.s.となり、有意な差はみとめられなかった。  したがって、タレント1の面白さ評定値には男女で差がないことがわかった。

対応のあるt検定(タレントごとに評定値を比較) /*データの読み込み*/ options ls=80; data nagano; infile 'data.txt' dlm='09'x; input subject $ sex $ q01-q04 q11-q14 q21-q24 q31-q34 q41-q44 q51-q54 q61-q64 q71-q74; /*対応のあるt検定 タレント6と7でかわいさに差はあるか?*/ proc ttest; paired q61*q71; /*対応のあるt検定 タレント5と7でかわいさに差はあるか?*/ paired q51*q71; /*対応のあるt検定 タレント0と1で面白さに差はあるか?*/ paired q04*q14; /*対応のあるt検定 タレント1と4で面白さに差はあるか?*/ paired q14*q44; run; ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、 akbT2.sasという名前で保存する。 かわいさ おもしろさ 自分で比較したい部分を選定し、プログラムを作成する!

q61-q71:タレント6-7間でかわいさ比較 q51-q71:タレント5-7間でかわいさ比較 かわいさ SAS システム 1 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q61 - q71 N 平均 標準偏差 標準誤差 最小値 最大値 41 -1.0732 1.1487 0.1794 -3.0000 2.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -1.0732 -1.4357 -0.7106 1.1487 0.9431 1.4698 自由度 t 値 Pr > |t| 40 -5.98 <.0001 SAS システム 2 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q51 - q71 N 平均 標準偏差 標準誤差 最小値 最大値 41 -0.3171 1.2337 0.1927 -3.0000 3.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -0.3171 -0.7065 0.0723 1.2337 1.0129 1.5785 自由度 t 値 Pr > |t| 40 -1.65 0.1077  かいわいさ評定値に関して、タレント6とタレント7の間に差があるかを対応のあるt検定により検討したところ、t(40)=5.98, p<.01となり、1%水準で有意な差がみとめられた。  したがって、タレント7のかわいさ評定値が、タレント6のかわいさ評定値に比べ有意に高いことがわかった。  かいわいさ評定値に関して、タレント5とタレント7の間に差があるかを対応のあるt検定により検討したところ、t(40)=1.65, n.s.となり、有意な差がみとめられなかった。  したがって、タレント5とタレント7のかわいさ評定値には差がないことがわかった。 かわいさ グラフと統計処理結果が対応しているか確認!

q04-q14:タレント0-1間で面白さ比較 q14-q44:タレント1-4間で面白さ比較 おもしろさ SAS システム 3 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q04 - q14 N 平均 標準偏差 標準誤差 最小値 最大値 41 -1.1951 1.2494 0.1951 -4.0000 2.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -1.1951 -1.5895 -0.8008 1.2494 1.0258 1.5986 自由度 t 値 Pr > |t| 40 -6.13 <.0001 SAS システム 4 2012年12月11日 火曜日 午後03時17分22秒 TTEST プロシジャ 差: q14 - q44 N 平均 標準偏差 標準誤差 最小値 最大値 41 -0.1220 0.8716 0.1361 -2.0000 2.0000 95% 平均の信頼限 95% 標準偏差の信頼 平均 界 標準偏差 限界 -0.1220 -0.3971 0.1532 0.8716 0.7156 1.1153 自由度 t 値 Pr > |t| 40 -0.90 0.3757  面白さ評定値に関して、タレント0とタレント1の間に差があるかを対応のあるt検定により検討したところ、t(40)=6.13, p<.01となり、1%水準で有意な差がみとめられた。  したがって、タレント1の面白さ評定値が、タレント0の面白さ評定値に比べ有意に高いことがわかった。  面白さ評定値に関して、タレント1とタレント4の間に差があるかを対応のあるt検定により検討したところ、t(40)=0.90, n.s.となり、有意な差がみとめられなかった。  したがって、タレント1とタレント4の面白さ評定値には差がないことがわかった。 おもしろさ グラフと統計処理結果が対応しているか確認!

相関係数計算用のデータを作成する 1.エクセルのワークシートから、 データ部分だけを選択しコピーする。 ← 2.TeraPadに貼り付け、 ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、data2.txtという名前で保存する。

各評定平均値どうしの相関を求める ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 /*データの読み込み*/ options ls=80; data nagano; infile 'data2.txt' dlm='09'x; input subject $ kawaii utukushii sexy omoshiroi; /*総当りで相関を計算する*/ proc corr; var kawaii utukushii sexy omoshiroi; run; ←のプログラムをコピーし、Terapadに貼り付ける。ファイルメニュー→文字/改行コード指定保存で、 文字コードをEUC 改行コードをLF にして、 akbCORR.sasという名前で保存する。

相関係数の計算結果 散布図と相関係数の対応を確認せよ! SAS システム 1 2012年12月17日 月曜日 午後01時55分16秒 CORR プロシジャ 4 変数 : kawaii utukushii sexy omoshiroi 要約統計量 変数 N 平均 標準偏差 合計 最小値 最大値 kawaii 8 2.89250 0.42250 23.14000 2.34000 3.46000 utukushii 8 2.50375 0.60469 20.03000 1.80000 3.41000 sexy 8 2.29875 0.55109 18.39000 1.61000 3.20000 omoshiroi 8 2.37750 0.54917 19.02000 1.68000 3.05000 Pearson の相関係数, N = 8 H0: Rho=0 に対する Prob > |r| kawaii utukushii sexy omoshiroi kawaii 1.00000 0.81432 0.78181 -0.37031 0.0139 0.0219 0.3665 utukushii 0.81432 1.00000 0.92929 -0.13199 0.0139 0.0008 0.7554 sexy 0.78181 0.92929 1.00000 -0.10343 0.0219 0.0008 0.8074 omoshiroi -0.37031 -0.13199 -0.10343 1.00000 0.3665 0.7554 0.8074 かわいい 美しい セクシー おもしろい 相関係数:-0.37  相関係数:0.81  相関係数:-0.13  相関係数:0.78  相関係数:0.93  相関係数:-0.10  かわいい、美しい、セクシー、面白いの4つの評定平均値に関し、相関係数を算出した。その結果、 かわいいと美しいの間に、5%水準で有意な正の相関(r=0.81)が、 かわいいとセクシーの間に、5%水準で有意な正の相関(r=0.78)が、 美しいとセクシーの間に、1%水準で有意な正の相関(r=0.93)が、 見られた。その他の評定値の間には、有意な相関関係はみられなかった。 したがって、かわいい、美しい、セクシーの各評定値は密接に関係しており、特に評定者は美しさとセクシー差を、ほとんど同じようにとらえている事がわかった。  散布図と相関係数の対応を確認せよ!