「ベースボール統一球は変わったのか」を検証,予測する。

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
名前:りくよう 番号 : 学習目標 現在日本の子供たちの考える力と学習意欲の状況 学力調査 を分析する その結果と原因を分析する 文法を活用.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
模型を用いたジェットコターの 力学的原理の検討 06522 住友美香 06534 秦野夏希. 平成22年度 卒業研究発表 山田研究室 研究目的 ジェットコースターのコースは、どのような計算に 基づいて作られているのか、研究を通じて理解し、 計算を用いた模型製作を行う。
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
野球好き女子の増加の理由と野球観戦の新たな価値について
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
EXCELで学ぶマーケティング統計 第4章 経営学研究科 M1  真島 健.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
現場における 熱貫流率簡易測定法の開発  五十嵐 幹郎   木村 芳也 
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
Excelによる統計分析のための ワークシート開発
収量を推測する -Excel- 2011年6月24日 理学部3回 青木陽輔.
LibreOffice大作戦 特定非営利活動法人 OpenOffice.org日本ユーザー会 鎌滝雅久
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
相模原理科教室 2011 Y字振子で絵を描こう 理科で遊ぼう会.
実証分析の手順 経済データ解析 2011年度.
第1回 担当: 西山 統計学.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
テーマ 自殺 ~なぜ地域差が出るのか~ 村瀬ゼミ.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
行動経済学による分析 ~なぜ人は「タダ」に翻弄されてしまうのか~ 古川ゼミ
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
☆日本における「SOA」の状況について 最近は、以前のような「どこを見てもSOAだ」、というような状況が
新入社員・若手研修.
貧困と出産の関係.
経営学部 経営学科 ITビジネスコース 菊地真実子
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
課題 1 P. 188 解答 ΔvapS = ΔvapH / T より、 T = ΔvapH / ΔvapS 解答
対応のあるデータの時のt検定 重さの測定値(g) 例:
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
ガウス過程による回帰 Gaussian Process Regression GPR
相関分析.
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
動学的一般均衡モデルについて 2012年11月9日 蓮見 亮.
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
~ 「スポーツにおけるゲーム分析」について ~
中国電力の脱原発の可能性 アカデミー6班 2年 川島 昭紀 (大東・経済) 久保田 藍 (大東・経済) 白根 秀一 (日本・経済)
2a グラフの用法.
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
中澤 港 統計学第4回 中澤 港
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
非対称リンクにおける ジャンボフレームの性能評価
「選挙の大切さについて」 資料モデル 1 選挙制度の意義や目的について、選挙の歴史や制度の特徴 などを踏まえてわかりやすく説明する。
音声分析 フーリエ解析の定性的理解のために.
母分散の信頼区間 F分布 母分散の比の信頼区間
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
本当は消去できていない!? ~データを完全消去する方法~
本当は消去できていない!? ~データを完全消去する方法~
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
回帰分析入門 経済データ解析 2011年度.
ゴールドバッハ予想における 組み合わせ数についての考察
野球自慢  皆さんこんにちは。甲南大学経営学部の東野 壮汰です。今回私が選んだタイトルは野球についての自慢です。 経営学部経営学科              東野 壮汰.
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

「ベースボール統一球は変わったのか」を検証,予測する。 21311257 平井 嵩大 21311006 荒井 貴雅 21311057 江川 亮 それでは我々の発表をさせていただきます。 3年の平井 嵩大     荒井 貴雅     江川 亮 今回、我々が発表するテーマは「野球のデータを基に予測し、検証する」ことであります。 ゼミで勉強したこと応用して分析しました。 それでは、本題に移ります。

みなさん、ご存知だろうか? 統一球問題 皆さんはご存知でしょうか? みなさん、ご存知だろうか? 統一球問題 皆さんはご存知でしょうか? 日本のプロ野球は2010年までホームのチームがボールを選ぶことができていました。ですが、公平性が欠くことがあるため、2011年から全試合でミズノ製の低反発ゴム材を用いた統一球が使われるようになりました。その結果、極端な「投高打低」つまりホームランがこれまでより少なくなったのです。では、みなさん球技競技で盛り上がるときはどういったときでしょうか? 点が入ったときですよね!

開幕から5月までのホームラン数 いきなりですが皆さんは今、2013年の6月にいると仮定してください。 そして、この表を見てください。 球団 開幕2010年 開幕2011年 開幕2012年 開幕2013年 巨人 78 38 28 53 中日 40 33 27 31 ヤクルト 36 25 広島 29 14 21 阪神 59 17 DeNA 32 34 44 日本ハム 23 30 43 西武 47 41 22 26 ソフトバンク 52 楽天 24 15 39 ロッテ 56 19 オリックス 20 いきなりですが皆さんは今、2013年の6月にいると仮定してください。 そして、この表を見てください。 2011年と2012年の開幕から6月までの時期には統一球に変わった影響で明らかにホームラン数が少なくなっています。では、2013年も統一球に変わった2011年、2012年とほぼほぼ変わらないだろうと考えられていましたが、我々が今いる2013年6月までのホームラン数は大幅に増えていることがわかります。この事実に各所から球が変わったのではないか?という噂が広がりました。しかし、NPBのコミッショナーである加藤良三はこの噂を否定しました。

5月末までのホームラン数比較:箱ひげ図 そこで各年度を比較するためにグラフを作成しました。 これは箱ひげ図といい、ばらつきのあるデータをわかりやすく表現することができる統計学的グラフです。 このグラフから読み取れることとしては、 (プロジェクターの前で箱ひげ図の説明) 1.この箱の下辺の第一四分位点、上辺の第三四分位点 2.箱の内側にあるこの線を中央値 3.上端にある線の最大値、下端にある線の最小値 が2011・2012年よりも2013年はすべてにおいて高いことがわかります。

5月末までのホームラン数比較:平均 判定 含まれている=>差がない=>違いがない 含まれていない=>差がある=>違いがある 2013年のボールは2011年のボール,2012年のボールとは違うのでは こちらは各年の平均をしめしたグラフです。 各年のプロットは平均±2×標準誤差で求めました。 このグラフの見かたとしては、2013年以外の年のバー(プロジェクターで教えてあげる)の範囲に別の年の平均が含まれているかどうかで 今回の場合はボールが変わっているのだろうか変わっていないのではないかを判定することができます。 では実際に見てみることにしましょう。 2010年のバーには・・・含まれています。 2011年のバーには・・・含まれていません。 2012年のバーには・・・含まれていません。 以上の2つのグラフから

ボールは変更されたのでは? 2013年のボールは2010年のボールとは違いがないかもしれない。一方、2011年と2012年のボールとは違うかもしれないことが考えられる。 では、噂どおりボールは変更されたのではないだろうか?

予測 散布図の数式を予測する シーズン中のホームラン数=a+b×5月末までのホームラン数 ※各年のシーズン中は同じ条件のボールを用いる    ※各年のシーズン中は同じ条件のボールを用いる そこで私たちはボールが変わったのではないかという噂を信じることにして、2013年の散布図の数式を予測してみることにしました。 そのために各年の散布図を作成し、近似曲線というデータの分析の問題を予測する際に使われる方法を採用し、分析することにしました。

統一球になる前の2010年 決定係数R2=0.861 より約86%説明できる こちらは2010年の散布図と近似曲線の数式と決定係数です。 Y=2.1868x+36.073 決定係数は0.861で約86%説明できます。 この決定係数が1に近いほど近似曲線の推定値が実際のデータにどの程度近いかの信頼度が高いことがわかります。

統一球になった2011・2012年 決定係数R2=0.680 決定係数R2=0.760 より約68%説明できる より約76%説明できる こちらは2011年・2012年の散布図と近似曲線です。 2011年はY=2.1163x+13.704、2012年はY=2.2262x+24.069 2011年、2012年の決定係数は2011年が0.760で約76%、2012年が0.680で約68%説明ができます。 決定係数R2=0.680 より約68%説明できる 決定係数R2=0.760 より約76%説明できる

予測する2013年 シーズン=30+2.2×5月末ホームラン数 2010年 2011年 2012年 2013年の予測は,これから シーズン=36+2.18×5月末ホームラン数 2011年 シーズン=13+2.12×5月末ホームラン数 2012年 シーズン=24+2.22×5月末ホームラン数 2013年の予測は,これから シーズン=30+2.2×5月末ホームラン数 そして、これまでのデータを基に分析した結果。 私たちが予測する2013年の数式はAを各年ほぼ同じであるため2.2とし、Bを2010年と2012年の間であると考え30、 それに5月末までのホームラン数をかけてシーズン=30+2.2×5月末ホームラン数と予測しました。 それでは、2013年の6月にいると仮定してましたが今、2013年のシーズンが終了しました。 私たちが予測した数式が間違っていないか検証してみましょう。

検証 決定係数R2=0.3939 より約40%説明できる Y=1.6009x+49.751 決定係数は0.3939で約40パー・・・ 予測は外れてしまいました。

まとめ 予測では 予測式を作成 実際では 2010年から2012年までの各年ではある程度予測 シーズン=28+2.2×5月末ホームラン数 シーズン=49+1.6×5月末ホームラン数 他の要因があったのでは 係数bが大きく変わっている原因は何か? まとめます。 2010年から2012年まではある程度予測ができました。 2010年から2012年の傾向から予測値を設定しました。 しかし、実際は違う結果となってしまいました。 つまり、2013年の統一球は変わっていたことになります。 今回の予測が外れた原因としては他に要因があったのではないかと考えられる。 1つ挙げるとしたら係数Bが大きく変わっている原因があるからだと考える。 この要因を今後、分析し、なぜ今回の予測が外れてしまったのかを解明し、 皆さんに説明ができるように今後も活動していきたいと思います。 以上で私たちの発表は終わります。 ご清聴ありがとうございました。