中澤 港 内線1453,minato@ypu.jp http://phi.ypu.jp/stat.html 統計学第4回 中澤 港 内線1453,minato@ypu.jp http://phi.ypu.jp/stat.html.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
経済統計学 第2回 4/24 Business Statistics
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
相関係数 植物生態学研究室木村 一也.
統計学 第3回 「データの尺度・データの図示」
第1回 担当: 西山 統計学.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計学 第3回 10/11 担当:鈴木智也.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計学 11/08(木) 鈴木智也.
1時限で理解する 統計の基礎 応用情報処理II 2015/12/4 講師:新居雅行.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
1変量データの記述 経済データ解析 2006年度.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

中澤 港 内線1453,minato@ypu.jp http://phi.ypu.jp/stat.html 統計学第4回 中澤 港 内線1453,minato@ypu.jp http://phi.ypu.jp/stat.html

代表値とは? データ全体の情報を1つの値に集約して示すもの。 分布の中心(位置)の指標とばらつきの指標がある。

分布の中心(位置)の指標 英語ではcentral tendencyという 狭義の代表値 平均値,中央値,最頻値がよく使われる。 他に幾何平均,調和平均などがある。

平均値(mean) データの総和をデータ数で割った値。物理的に考えれば重心と等しい。 データ全部を使うが,極端な外れ値や歪んだ分布のときに代表性が弱くなる。 間隔尺度または比尺度でないと計算する意味がない。

中央値(median) データを大小関係に従って順番に並べたときの真中の値。 順序尺度以上の尺度で計算できる。 外れ値や歪んだ分布に強い。

最頻値(mode) 頻度の最も高い値。 名義尺度でも得られる。

分布の中心(位置)のその他の指標 幾何平均(geometric mean):積の累乗根。データの分布が対数正規分布に近い場合によく使われる。実際にはデータを対数変換してから平均値を出し,それを元に戻すと幾何平均になる。 調和平均(harmonic mean):逆数の平均値の逆数。0を含むデータには使えないが,外れ値には強い。

分布のばらつき(variability)の指標 範囲,四分位範囲,四分位偏差,平均偏差,分散,不偏分散,標準偏差,不偏標準偏差といったものがある。 他に変動係数(Coefficient of Variation; CV=標準偏差を平均値で割った値)も,相対的なばらつきの尺度としてよく使われる。

範囲(range) 単純に最大値と最小値の差をとったもの。 外れ値の影響を受けやすい。

四分位範囲(IQR)と四分位偏差(SIQR) 順番に並べたデータを4つに分割して,上から1/4の点と下から1/4の点の差をとったものが四分位範囲,その半分が四分位偏差である。 外れ値や分布の歪みの影響を受けにくいという利点をもつ。 検定を順位検定や順位和検定など,ノンパラメトリックな(分布を仮定しない)方法でやる場合は,分布が歪んでいたり外れ値がある場合なのだから,代表値も平均と標準偏差ではなく,中央値と四分位偏差で出すべき。

平均偏差(mean deviation) 平均値と各データの差の絶対値の総和をデータ数で割った値 全データを使う 1つの外れ値の影響は受けにくい 絶対値を使うために,統計量として,他の統計量と数学的な関連をもたない 標本統計量から母集団統計量を推定するのには使えない。

分散(variance)と 不偏分散(unbiased variance) 分散は,平均と各データの差の二乗の和をデータ数で割った値。 不偏分散は,データ数で割る代わりにデータ数から1を引いた「自由度」で割ったもの。標本データから母集団の分散を推定するときはこちらを用いる。

標準偏差(SD)と不偏標準偏差 標準偏差は分散の平方根,不偏標準偏差は不偏分散の平方根である。 もっとも普通に使われるばらつきの指標