アイドルと練習生期間との関係.

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
配偶者選択による グッピー (Poecilia reticulata) の カラーパターンの進化 :野外集団を用いた研究 生物多様性進化分野 A1BM3035 吉田 卓司.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章補足 分散分析法入門 統計学 2010年度.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
相関係数 植物生態学研究室木村 一也.
プロ野球観客動員数の 要因分析.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
アジア開発銀行(ADB)の 融資による途上国の経済成長への影響
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
タレントの魅力測定とその分析.
回帰分析.
貧困と出産の関係.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第3章 重回帰分析 ー 計量経済学 ー.
数理統計学  第8回 西山.
第3章 重回帰分析 ー 計量経済学 ー.
フットサルシューズの最適化 ~コンジョイント分析を用いて~
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
回帰分析/多変量分析 1月18日.
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
相関分析.
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
市場規模の予測.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
統計学 西 山.
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場規模の予測.
母音[i]のF1, F2平均値の分析.
部分的最小二乗回帰 Partial Least Squares Regression PLS
分散分析、判別分析、因子分析.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「パレスチナ社会の民主主義的価値観」 報告のアウトライン はじめに 民主主義的価値観 仮説とデータ 検証1:パレスチナ社会における民主化の
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
回帰分析(Regression Analysis)
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
プログラミング論 相関
サンプリングと確率理論.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
推しグループ自慢 TOMORROW X TOGETHER 文学部歴史文化学科 清水弓矢
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

アイドルと練習生期間との関係

目次 1.テーマの設定理由 2.仮説立案 3.データ資料 4.データの出典 5.仮説の検証 6.まとめ 7.考察

1.テーマの設定理由 韓国のアイドルは、それぞれ何カ月から何年間にわたる、いわゆる「練習生期間」を経てデビューに至る。 「幼いころからダンスをやっていた人は、背が小さい」という通説を確認してみたい。 練習生期間と身長との関係以外に相関がありそうな要素は何があるだろうか。

2.仮説立案 1)「幼い頃に練習を始めた人ほど背が小さい」 2)「練習生期間が長かった人ほど、音楽番組の1位回数が多い」 3)「練習生期間が長かった人ほど日本で人気がある」

3.データ資料(男子8グループ、36名) 名前 グループ名 性別 練習開始年齢 練習期間 身長 音楽番組1位回数 mixi会員数 YOONHO 東方神起 男 16 36 184 28 27072 CHANGMIN(1) 14 30 186 29824 JAEJUNG JYJ 180 30903 YUCHEON 17 18 36668 JUNSU(1) 13 72 178 25475 T.O.P BIG BANG 179 13414 G-DRAGON 8 132 172 44 20393 SOL 168 41 3766 D-LITE 2.5 175 35 2658 V.I 170 40 3523 TAECYEON 2PM 19 24 185 2823 JUNSU(2) 48 2059 WOOYOUNG 4 2592 NICHKHUN 3194 JUNHO 2199 CHANSUNG 3979 JOKWON 2AM 90 173 2 3720 CHANGMIN(2) 23 3 545 SEULONG 20 1213 JINWOON 1772 ONEW SHINee 177 5985 JONGHYUN 4891 KEY 15 6092 MINHO 181 1963 TAEMIN 42 8703 SEUNGHO MBLAQ 60 176 1971 G.O 2078 JOON 3895 CHEONDUNG 18.5 2577 MIR 2481 DUJUN BEAST 6 4133 YOSEOP 4214 GIKWANG 3060 DONGWOON 2067 JUNHYUNG 4119 HYUNSEUNG 174 3152

3.データ資料(女子6グループ、32名) 名前 グループ名 性別 練習開始年齢 練習期間 身長 音楽番組1位回数 mixi会員数 TAE YEON 少女時代 女 16 36 159 44 15729 YOONA 13 60 166 19954 JESSICA 12 87.6 161 9037 TIFFANY 160 12265 SOO YOUNG 78 170 14738 YURI 72 167 6401 SUNNY 14 48 157 4292 HYOYEON 84 2147 SEOHYUN 168 8876 SUNYE Wonder Girls 21 172 YUBIN 18 24 163 136 SOHEE 30 102 YEEUN 19 165 88 HYERIM 15 164 GYURI KARA 8 9357 SEUNG YEON 17929 NICOLE 19518 HARA 3 162 33980 JIYOUNG 0.5 21596 BOM 2NE1 22 6780 SANDARA 5646 CL 4150 MINJI 2582 VICTORIA f(x) 20 5 2244 AMBER 798 LUNA 42 158 716 KRYSTAL 1131 SULLI 1765 MIN Miss A 90 2 281 SUZY 10 654 FEI 198 JIA 310

4.データの出典 ★ウィキペディア(韓国版・日本版) ★mixi(http://mixi.jp/home.pl) ★各グループの公式サイト http://toho-jp.net/index.html http://www.ygbigbang.jp/ http://www.2pmjapan.com/ http://shinee.jp/ http://www.mblaq.jp/ http://www.beast-beauty.com/ http://www.girls-generation.jp/ http://www.karaweb.jp/

5.仮説の検証 1)「幼い頃に練習を始めた人ほど背が小さい」-男子 モデル集計 モデル R R2乗 調整済みR2乗 推定値の標準誤差 1 .481a .231 .208 2.229 a. 予測値: (定数)、身長。 分散分析b モデル 平方和 (分散成分) 自由度 平均平方 F 値 有意確率 1 回帰 50.722 10.209 .003a 残差 (分散分析) 168.917 34 4.968 合計 (ピボットテーブル) 219.639 35 a. 予測値: (定数)、身長。 b. 従属変数 練習開始年数 男子アイドルの身長と練習開始年齢との相関係数は0.481で、中間くらいの正の関係があると言える。F検定の結果も0.003で、0.05以下なので、回帰モデルは成立すると判断できる。

5.仮説の検証 1)「幼い頃に練習を始めた人ほど背が小さい」-女子 モデル集計   モデル R R2乗 調整済みR2乗 推定値の標準誤差 1 .026a .001 -.033 3.443 a. 予測値: (定数)、身長。 分散分析b 平方和 (分散成分) 自由度 平均平方 F 値 有意確率 回帰 .247 .021 .886a 残差 (分散分析) 355.722 30 11.857 合計 (ピボットテーブル) 355.969 31 b. 従属変数 練習開始年数 女子アイドルの身長と練習開始年齢との相関係数は0.026で、ほとんど関連がないと言える。F検定の結果を見てみると、0.886という大きい数値が出ていることが分かる。回帰モデルも成立しないということになる。

5.仮説の検証 2)「練習生期間が長かった人ほど、音楽番組の1位 回数が多い」 2)「練習生期間が長かった人ほど、音楽番組の1位  回数が多い」 モデル集計   モデル R R2乗 調整済みR2乗 推定値の標準誤差 1 .297a .088 .075 25.2524 a. 予測値: (定数)、音楽番組1位回数。 分散分析b 平方和 (分散成分) 自由度 平均平方 F 値 有意確率 回帰 4085.064 6.406 .014a 残差 (分散分析) 42087.163 66 637.684 合計 (ピボットテーブル) 46172.227 67 b. 従属変数 練習期間 相関係数は0.297で、弱い正の相関があることが分かる。また、F値の有意確立は0.014で、成立する回帰モデルということも分かってくる。

5.仮説の検証 3)「練習生期間が長かった人ほど日本で人気がある」 モデル集計   モデル R R2乗 調整済みR2乗 推定値の標準誤差 1 .028a .001 -.014 26.4394 a. 予測値: (定?)、mixi会員数。 分散分析b 平方和 (分散成分) 自由度 平均平方 F 値 有意確率 回帰 35.320 .051 .823a 残差 (分散分析) 46136.907 66 699.044 合計 (ピボットテーブル) 46172.227 67 a. 予測値: (定数)、mixi会員数。 b. 従属変数 練習期間 相関係数はー0.028で弱い不の相関が見られる。F検定の有意確立も0.823で、回帰モデルも妥当ではないと判断される。

6.まとめ 仮説1)「幼い頃に練習を始めた人ほど背が小さい」という仮説に対しては、男子と女子との違いがみられた。男子は両変数間の関係性が見られ、仮説がある程度成立すると言える結果がでた反面、女子の場合はほとんど関係がなく、仮説は当てはまらないという結果がでた。 仮説2)「練習生期間が長かった人ほど、音楽番組の1位回数が多い」の分析結果は、両変数は弱い関係を持っているということだった。この分析での「練習期間が長い」ということは、その分、実力をつむ時間が長かったことを意味し、「音楽番組で1位を獲得した回数が多い」ということは、その分いいパフォーマンスで大衆に愛されたことを意味する指標の一種である。 仮説3)「練習生期間が長かった人ほど日本で人気がある」の結果は、両変数の間ではほとんど関係がないということだった。

7.考察 仮説1)のような結果がでた理由は、男子の方が女子より短期間で急激な成長をするため。もしくは、女子より男子のダンスが激しいためと考えて良いのだろうか。 仮説2)この分析にはアイドル個人のデータを用いて分析を行ったが、実はアイドルは大体グループ活動をすることが多い。その中で1位を取れる要因は、個人の実力が含まれないとは言い切れないが、それ以外にもさらに複雑な要素が交わっているようである。 仮説3)は、データの指定が一番難しかった。日本での人気を全てのアイドルに公平に数値化することが困難で、データの設定に関して少し疑問が残る。やはりデビュー前とはいえ、各事務所の練習生の情報はファンの間で出回るようになり、その分認知度を上げられると考えた。それが日本でも適用されるのかを検定することが仮説3)の一番の目的であったが、上手くいかなかたようで少し残念に思う。