統計学 10/19 鈴木智也.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
シミュレーション論Ⅰ 第 7 回 待ち行列のシミュレーション(2). 第 6 回のレポート(解答例) 乱数表より乱数を記入し、到着間隔・サービス時間にした がってグラフを作成する 例) 最大待ち人数:2人 最大待ち時間:5分 平均待ち時間:3分.
統計学入門(1) 第 10 回 基本統計量:まとめ. 統計学第 8 回 2 前回の練習問題の解答 (1) から (4) に対応するヒストグラムはそれぞれどれか。
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
ローレンツ曲線とジニ係数 度数分布表の応用 ローレンツ曲線の意味 ローレンツ曲線の作成 ジニ係数.
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
経済統計学 第2回 4/24 Business Statistics
統計解析 第7回 第6章 離散確率分布.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学 10/25(木) 鈴木智也.
統計学 12/3(月).
統計学 11/13(月) 担当:鈴木智也.
第1回 担当: 西山 統計学.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
経済統計 第三回 5/1 Business Statistics
統計学 11/30(木).
行動計量分析 Behavioral Analysis
統計学 11/19(月) 担当:鈴木智也.
統計学 12/13(木).
統計学 第3回 10/11 担当:鈴木智也.
統計学 第1週 9/27(木) 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
統計解析 第1章 データの表現.
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
月曜3限 1141教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1141教室 担当者: 河田 正樹
数理統計学 第11回 西 山.
統計リテラシー育成のための数学の指導方法に関する実践的研究
1変量データの記述 経済データ解析 2006年度.
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
確率と統計 Probability & Statistics
確率と統計 Probability & Statistics
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
資料の活用.
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
信頼性設計法を用いた構造物の 崩壊確率の計算
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
本時の目標 相対度数の意味を理解し、二つのデータを比較してその傾向を分析することができる。
シミュレーション論Ⅰ 第7回 シミュレーションの構築と実施.
代表値と散らばり.
クロス表とχ2検定.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
統計学  第9回 西 山.
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
数理統計学  第6回 西山.
第2章 統計データの記述 データについての理解 度数分布表の作成.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

統計学 10/19 鈴木智也

今回の講義の位置づけ 第1部:記述統計 第2部:確率論 第3部:推測統計 第1部の構成 一変数の規則性を記述する  第1部の構成 一変数の規則性を記述する  分布を表・グラフに表す ← ここ 二変数の関係を記述する

はじめに 細かい数字がびっしり並んだだけのデータから、意味あることを読み取るのは困難。 ⇒集めたデータを読みやすく整理する。  細かい数字がびっしり並んだだけのデータから、意味あることを読み取るのは困難。 ⇒集めたデータを読みやすく整理する。 ⇒データがどの範囲にどのくらいの頻度で分布しているかを、表やグラフにまとめる。 小学校の算数でやったこと!

基本的な手順 準備:データを大きさ順に並べ替えて、幾つかの「級(Class)」に分ける。 (基本的に級の間隔を等しくする。) ①各級に幾つデータが入っているかを表にする。⇒度数分布表 ②それを柱状グラフで表す。⇒ヒストグラム

例:学生50人の体重の度数分布 体重(kg) 人数 50~54.5 4 55~59.9 6 60~64.9 13 65~69.9 17   体重(kg)    人数   50~54.5 4   55~59.9 6   60~64.9 13   65~69.9 17   70~74.9   75~79.9

例:そのヒストグラム

応用①:相対度数分布(重要) 各級の度数を、全度数に対する割合にしたものを「相対度数分布」という。 たとえば、前の例では、 50~54.5kg:50人中4人⇒4/50⇒8% 55~59.9kg:50人中6人⇒6/50⇒12% ⇒相対度数分布は確率分布へ応用(第2部)

例:学生50人の体重の相対分布 体重(kg) 相対頻度(%) 50~54.9 8 55~59.9 12 60~64.9 26 65~69.9   体重(kg)   相対頻度(%)   50~54.9 8   55~59.9 12   60~64.9 26   65~69.9 34   70~74.9   75~79.9

例:そのヒストグラム

応用②:累積度数分布 全体の度数の中で、ある値以下の値を取る度数、もしくはある値以上の値を取る度数を表示する⇒累積度数 たとえば、前の例では、  50~54.9kg:4人 + 55~59.9kg:6人 ⇒60kg未満:10人 60~64.9kg:13人 ⇒ 65kg未満:23人

例:学生50人の体重の累積度数 体重(kg) 累積度数(人数) 50~54.9 4 55~59.9 10 60~64.9 23   体重(kg)  累積度数(人数)   50~54.9 4   55~59.9 10   60~64.9 23   65~69.9 40   70~74.9 46   75~79.9 50

例:そのヒストグラム

実例:なぜグラフが有用なのか? 総務省「家計調査(2004年)」によれば、日本の勤労者世帯では、 平均貯蓄額:1,273万円!! ⇒ そんなに貯蓄のある人が多いのか? ⇒ No! ⇒ 実は分布に偏りがあり、平均値では偏りが分らない。 ⇒ グラフ化すると分る。

勤労者世帯の貯蓄高の分布

度数分布作成上の注意点 級間隔が小さいと、結果が見づらい。 級間隔が大きいと、結果が大雑把に。 ⇒級の間隔を適切に決めるのは、各自の腕の見せどころ。 *級を決める際の目安として「スタージスの公式」があるが、必ずしも守る必要なし。

進んだ知識(前回のQ6) データの観測値が多ければ、 平均±標準偏差:度数の68%の範囲 平均±標準偏差×2:度数の95%の範囲 ⇒サンプルが大きければ、平均と標準偏差で、データの分布具合を記述可能。

ここまで習ったことは後で応用 確率論を学ぶ際に、理解を助ける。 期待値(後述) ←加重平均の応用 ⇒確率をウェイトにする 期待値(後述) ←加重平均の応用 ⇒確率をウェイトにする 確率分布(後述) ←度数分布の応用 ⇒ある範囲の値を取った「頻度」の代わりに、その値を取りそうな「確率」を調べる。