統計学 第3回 10/11 担当:鈴木智也.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
確率・統計学の基礎 データの特性を表すパラメータとは? 2 つのデータの関係性を表す式の導出方法.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
経済統計学 第2回 4/24 Business Statistics
統計解析 第7回 第6章 離散確率分布.
統計学 10/25(木) 鈴木智也.
統計学  第7回 西 山.
実証分析の手順 経済データ解析 2011年度.
相関係数 植物生態学研究室木村 一也.
統計学 12/3(月).
統計学 11/13(月) 担当:鈴木智也.
第1回 担当: 西山 統計学.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
統計解析 第9回 第9章 正規分布、第11章 理論分布.
経済統計 第三回 5/1 Business Statistics
統計学 11/30(木).
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
ポートフォリオ管理 Portfolio Management
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
統計学 11/19(月) 担当:鈴木智也.
統計学 12/13(木).
統計学 10/19 鈴木智也.
統計学 第1週 9/27(木) 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
統計学  第6回 西山.
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
 統計学講義 第11回     相関係数、回帰直線    決定係数.
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
中澤 港 統計学第4回 中澤 港
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
母分散の信頼区間 F分布 母分散の比の信頼区間
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
統計学  第9回 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
数理統計学  第6回 西山.
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
プログラミング論 相関
データ分布の特徴 基準化変量 歪度 尖度.
回帰分析入門 経済データ解析 2011年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

統計学 第3回 10/11 担当:鈴木智也

前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが「記述統計」、データを生み出した背景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、まずは記述統計から学ぶ。 以下、データの観測値をX1、X2・・・と表す。

講義の流れ 第1部:記述統計 ← 今はここ 第2部:確率論 第3部:推測統計 第1部の構成 一変数の規則性を記述する ← ここ! 第1部:記述統計 ← 今はここ 第2部:確率論 第3部:推測統計 第1部の構成 一変数の規則性を記述する ← ここ! 規則性を視覚化する 二変数の関係を記述する

今日のトピック 一変数ついて、規則性を数量的に把握。 三つの基本的な指標 平均 ← データの代表値(の一つ) 平均 ← データの代表値(の一つ) 分散 ← 標準偏差を出すために導出 標準偏差 ← データの散らばり具合

平均(Mean) ☆平均(小学校の算数で履修済み) X のデータから、m 個の観測値について、大体どれ位の値になるかの指標。

分散(Variance) ☆分散 Xi が概ね平均値からどのくらい離れているかを表す指標。(散らばり具合を記述) Q:なぜ二乗しているのかを考えてみよう。

標準偏差(Standard Deviation) ☆標準偏差 ← 誤差の平均 これも散らばり具合を表す指標。  注:分散は二乗を取って計算しているので、元々の単位とは異なる。 ⇒分散の平方根を取って「標準化」することで、平均値と比較可能になる。

応用①:加重平均 単純平均 加重平均(次の例題を参照のこと)

例題(加重平均の使い方) 食堂が二つの定食を出しており、価格と一日あたりの売上げは以下の通りである。 Aセット 500円 70食/一日 Aセット 500円 70食/一日 Bセット 600円 30食/一日  一食あたりの平均売上げはいくらになるのか計算せよ。

誤った解答の代表例 AセットとBセットの価格の単純平均 ⇒単純平均では、売上げ全体について、 Aセットの貢献度:過小評価 Bセットの貢献度:過大評価 (AセットとBセットの売上げ比率は7:3。)

正しい解答 AセットとBセットの売上比率が70%、30%なので、ウェイトを0.7、0.3に設定。 別解としては、全食の売上金額を合計し、売上件数100で割る方法もある。

加重平均の適用例 TOPIX(東証平均株価) ⇒上場株式数でウェイトづけ。 (注)日経平均株価は単純平均 消費者物価指数 ⇒物価を品目別にウェイトづけして算出。 ファイナンス理論:期待収益率の計算 ⇒収益率を確率でウェイトづけする。

加重平均した場合の分散 もしも平均を加重平均で算出するなら、分散も同じようにウェイトづけをして算出。 これはファイナンスで「リスク」を計算する際に多用する(詳細は『金融論』等で)。

応用②:変動係数 例:先進国Aと途上国B、どちらが貧富の差が激しいのか? 貧富の差は所得の散らばり具合を二国で比べればよい。 ⇒分散や標準偏差をそのまま比較すれば、平均所得の高い先進国の方が、単位が大きい分、所得のちらばりが大になる。

変動係数(続き) ⇒平均所得から概ねどのくらいの範囲に散らばっているかを比較可能にしたい。 ⇒標準偏差を平均値で割ってやる。

応用③:標準化変量 ある観測値がデータ全体の中でどのくらいの位置にあるのかは、平均値と標準偏差を用いて、「標準化」した「変量」で測る。 (注)「標準化」の手順は統計学では頻出!

標準化変量の適用 学力テストの偏差値は、平均点を50にして、標準化変量を10倍して算出している。 異なるデータ間で学力を比較できる方法の一つ。

付論 平均値以外の代表値の指標としては、次の二つがよく用いられる。 (1)中位数(Median) データを大きさの順に並べたとき、ちょうど中央に位置する値。 (2)最頻値(Mode)  最も多くのデータが集中している値。