Download presentation
Presentation is loading. Please wait.
1
「ベースボール統一球は変わったのか」を検証,予測する。
21311257 平井 嵩大 21311006 荒井 貴雅 21311057 江川 亮 それでは我々の発表をさせていただきます。 3年の平井 嵩大 荒井 貴雅 江川 亮 今回、我々が発表するテーマは「野球のデータを基に予測し、検証する」ことであります。 ゼミで勉強したこと応用して分析しました。 それでは、本題に移ります。
2
みなさん、ご存知だろうか? 統一球問題 皆さんはご存知でしょうか?
みなさん、ご存知だろうか? 統一球問題 皆さんはご存知でしょうか? 日本のプロ野球は2010年までホームのチームがボールを選ぶことができていました。ですが、公平性が欠くことがあるため、2011年から全試合でミズノ製の低反発ゴム材を用いた統一球が使われるようになりました。その結果、極端な「投高打低」つまりホームランがこれまでより少なくなったのです。では、みなさん球技競技で盛り上がるときはどういったときでしょうか? 点が入ったときですよね!
3
開幕から5月までのホームラン数 いきなりですが皆さんは今、2013年の6月にいると仮定してください。 そして、この表を見てください。
球団 開幕2010年 開幕2011年 開幕2012年 開幕2013年 巨人 78 38 28 53 中日 40 33 27 31 ヤクルト 36 25 広島 29 14 21 阪神 59 17 DeNA 32 34 44 日本ハム 23 30 43 西武 47 41 22 26 ソフトバンク 52 楽天 24 15 39 ロッテ 56 19 オリックス 20 いきなりですが皆さんは今、2013年の6月にいると仮定してください。 そして、この表を見てください。 2011年と2012年の開幕から6月までの時期には統一球に変わった影響で明らかにホームラン数が少なくなっています。では、2013年も統一球に変わった2011年、2012年とほぼほぼ変わらないだろうと考えられていましたが、我々が今いる2013年6月までのホームラン数は大幅に増えていることがわかります。この事実に各所から球が変わったのではないか?という噂が広がりました。しかし、NPBのコミッショナーである加藤良三はこの噂を否定しました。
4
5月末までのホームラン数比較:箱ひげ図 そこで各年度を比較するためにグラフを作成しました。
これは箱ひげ図といい、ばらつきのあるデータをわかりやすく表現することができる統計学的グラフです。 このグラフから読み取れることとしては、 (プロジェクターの前で箱ひげ図の説明) 1.この箱の下辺の第一四分位点、上辺の第三四分位点 2.箱の内側にあるこの線を中央値 3.上端にある線の最大値、下端にある線の最小値 が2011・2012年よりも2013年はすべてにおいて高いことがわかります。
5
5月末までのホームラン数比較:平均 判定 含まれている=>差がない=>違いがない
含まれていない=>差がある=>違いがある 2013年のボールは2011年のボール,2012年のボールとは違うのでは こちらは各年の平均をしめしたグラフです。 各年のプロットは平均±2×標準誤差で求めました。 このグラフの見かたとしては、2013年以外の年のバー(プロジェクターで教えてあげる)の範囲に別の年の平均が含まれているかどうかで 今回の場合はボールが変わっているのだろうか変わっていないのではないかを判定することができます。 では実際に見てみることにしましょう。 2010年のバーには・・・含まれています。 2011年のバーには・・・含まれていません。 2012年のバーには・・・含まれていません。 以上の2つのグラフから
6
ボールは変更されたのでは? 2013年のボールは2010年のボールとは違いがないかもしれない。一方、2011年と2012年のボールとは違うかもしれないことが考えられる。 では、噂どおりボールは変更されたのではないだろうか?
7
予測 散布図の数式を予測する シーズン中のホームラン数=a+b×5月末までのホームラン数 ※各年のシーズン中は同じ条件のボールを用いる
※各年のシーズン中は同じ条件のボールを用いる そこで私たちはボールが変わったのではないかという噂を信じることにして、2013年の散布図の数式を予測してみることにしました。 そのために各年の散布図を作成し、近似曲線というデータの分析の問題を予測する際に使われる方法を採用し、分析することにしました。
8
統一球になる前の2010年 決定係数R2=0.861 より約86%説明できる こちらは2010年の散布図と近似曲線の数式と決定係数です。
Y=2.1868x+36.073 決定係数は0.861で約86%説明できます。 この決定係数が1に近いほど近似曲線の推定値が実際のデータにどの程度近いかの信頼度が高いことがわかります。
9
統一球になった2011・2012年 決定係数R2=0.680 決定係数R2=0.760 より約68%説明できる より約76%説明できる
こちらは2011年・2012年の散布図と近似曲線です。 2011年はY=2.1163x+13.704、2012年はY=2.2262x+24.069 2011年、2012年の決定係数は2011年が0.760で約76%、2012年が0.680で約68%説明ができます。 決定係数R2=0.680 より約68%説明できる 決定係数R2=0.760 より約76%説明できる
10
予測する2013年 シーズン=30+2.2×5月末ホームラン数 2010年 2011年 2012年 2013年の予測は,これから
シーズン= ×5月末ホームラン数 2011年 シーズン= ×5月末ホームラン数 2012年 シーズン= ×5月末ホームラン数 2013年の予測は,これから シーズン=30+2.2×5月末ホームラン数 そして、これまでのデータを基に分析した結果。 私たちが予測する2013年の数式はAを各年ほぼ同じであるため2.2とし、Bを2010年と2012年の間であると考え30、 それに5月末までのホームラン数をかけてシーズン=30+2.2×5月末ホームラン数と予測しました。 それでは、2013年の6月にいると仮定してましたが今、2013年のシーズンが終了しました。 私たちが予測した数式が間違っていないか検証してみましょう。
11
検証 決定係数R2=0.3939 より約40%説明できる Y=1.6009x+49.751 決定係数は0.3939で約40パー・・・
予測は外れてしまいました。
12
まとめ 予測では 予測式を作成 実際では 2010年から2012年までの各年ではある程度予測 シーズン=28+2.2×5月末ホームラン数
シーズン=49+1.6×5月末ホームラン数 他の要因があったのでは 係数bが大きく変わっている原因は何か? まとめます。 2010年から2012年まではある程度予測ができました。 2010年から2012年の傾向から予測値を設定しました。 しかし、実際は違う結果となってしまいました。 つまり、2013年の統一球は変わっていたことになります。 今回の予測が外れた原因としては他に要因があったのではないかと考えられる。 1つ挙げるとしたら係数Bが大きく変わっている原因があるからだと考える。 この要因を今後、分析し、なぜ今回の予測が外れてしまったのかを解明し、 皆さんに説明ができるように今後も活動していきたいと思います。 以上で私たちの発表は終わります。 ご清聴ありがとうございました。
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.