ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.

Slides:



Advertisements
Similar presentations
分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
Advertisements

統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
確率・統計学の基礎 データの特性を表すパラメータとは? 2 つのデータの関係性を表す式の導出方法.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
MS-EXCEL、 OpenCalcを 用いた表計算
「ベースボール統一球は変わったのか」を検証,予測する。
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
第2章 1変量データの記述 統計学基礎 2011年度.
ローレンツ曲線とジニ係数 度数分布表の応用 ローレンツ曲線の意味 ローレンツ曲線の作成 ジニ係数.
第1章 記述統計の復習 統計学 2007年度.
数理統計学 西 山.
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
第1章 記述統計の復習 統計学 2011年度.
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
データ解析 静岡大学工学部 安藤和敏
統計学  第7回 西 山.
第1回 担当: 西山 統計学.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1章 記述統計の復習 統計学 2010年度.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学 第3回 10/11 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
対応のあるデータの時のt検定 重さの測定値(g) 例:
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
情報処理3 第5回目講義         担当 鶴貝 達政 11/8/2018.
数理統計学 第4回 西山.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
中澤 港 統計学第4回 中澤 港
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
計測工学 -誤差、演習問題 計測工学(第6回) 2009年5月26日 Ⅱ限目.
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
数理統計学 西 山.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第3章 線形回帰モデル 修士1年 山田 孝太郎.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
代表値と散らばり.
統計学  第9回 西 山.
統計処理1 平均・分散・標準偏差.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
プログラミング論 相関
Presentation transcript:

ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい

代表値 各品種の100個以上のデータを 1つの数値で代表させる 中心を表す値である ( ) 平均 メジアン(中央値) モード(最頻値)

代表値をみる 平均メジア ン モード 松江城(赤) 石見銀山(青) ( ) ~ ~ 180

石見銀山 平均値はほとんど同じだけど・・・ 平均 平均 平均値は同じでも上のような違いがある場合,そ れを1つの数字で表現できないだろうか? アクアス

( )を考える ( ) ばらつき 分散 標準偏差 レンジ(範囲) 四分位範囲 変動係数

種々の統計量

代表値 中心を表す値 ( ) すべての観測値を足しあわせて,観測数で 割ったもの 例題 5 羽のにわとりはそれぞれ1,2,0,2,0個の卵を産 みました. 平均でいくつの卵を産みましたか? 平均

代表値 中心を表す値 ( )データを大きさの順に並べて データが奇数個なら中央に位置するデータの値 データが偶数個なら中央に位置する2つのデータ の平均である 例1 11,14,15,17,20 例2 2,4,8,10,12,16 メジアン

代表値 中心を表す値 ( ) 集めたデータの中で,最も多く現れた値あるいは 階級のこと. 名目データではモードを代表値とする 例題 5 羽のにわとりはそれぞれ1,2,0,2,0個の卵を産 みました. モードはいくらですか? モード

モードの例 名目データの場合 アサガオを 20 株調べた. 10 株は青い花, 6 株は紫の花, 4 株は白い花だった.花の色のモードは?

モード 松江城出雲大社石見銀山三瓶山アクアス

ばらつきを表す値 それぞれのデータと平均の差 「それぞれのデータ」-「平均」 偏差 ( ) V 平均からの偏差の二乗の和を n-1 で割ったもの 平方和 S 平均からの偏差の二乗の和 単位は元の値の2乗となる データがばらつくとは? 平均から個々のデータが外れること 分散

ばらつきを表す値 ( ) S.D. 分散の正の平方根.単位が元のデータや平均と同じになる ( ) 最大値と最小値の差 もっとも両極端な値を使っているので信頼は低い 両方とも異常値であることもある. 標準偏差 レンジ(範囲)

ばらつきを表す値 四分位範囲 第3四分位点と第1四分位点の差である. 第1四分位点はデータを大きさの順に並べて,最小値から 数えて,全体の4分の1番目に当たるデータの値である. 第3四分位点は同じく全体の4分の3番目に当たるデータ の値である.メジアンは第2四分位点と一致する. ( ) 標準偏差を平均で割ったものでばらつきの大きさを 相対的に評価する時に使う. おおまかに 5 %以下だと小さいばらつき, 6-14 %はふつうの ばらつき, 15 %以上は大きいばらつきと考える 変動係数

エクセルによる統計の計算方法 例題: 山を調査して発見したツキノワグマの頭数 3, 5, 6, 8, 11 頭 平均 分散 標準偏差 メジアン レンジ 変動係数

エクセルでの関数の使い方 C4 C8 平均 分散 標準偏差 メジアン レンジ 変動係数

分析ツールによる計算方法 1.データ → 分析ツール

基本統計量を選ぶ

データの範囲を指定する

指定した出力先に計算結果が出る 変動係数は標準偏差と 平均の値を使って別に 計算する

練習問題 ① 農園で収穫したミカンの数 11,13,15,17,22,27,36,41,55 平均 分散 標準偏差 メジアン レンジ(範囲) 変動係数

練習問題 ② 根の長さ 1.4, 2.7, 5.9, 6.3, 10.5, 13.1, 15.0, 18.2, 22.7 cm 平均 cm 分散 cm 2 標準偏差 cm メジアン cm レンジ(範囲) cm 変動係数 % 分散の単位に注意

第2回の予習をやってみましょう