ヒストグラム 考え方と作り方 産業統計論 2004 年. 量的変数で区分された相対度数 相対度数 下位集団の大きさを全集団に占める割合として示したもの 質的変数と量的変数 たとえば、男女別集計のような場合は、あるかないかどちらかである。 (どちらでも内を含めてもよい) これに対し、身長や体重、テストの点数、資産、所得などは、本来連.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
第14回:表計算の発展的話題 2015 年 7 月 21 日 清見礼.  本日の授業の資料は今日中に 7/jc2015.html においておく。  どうしてもうまくダウンロードできない、見るこ とができない、などあれば.
1 通信教育学部 コンピュータ演習 Excel の書式設定と関数 授業ページ「コンピュータ演習(通信教育学 部)」を 開いてください。提出課題の一覧が掲載されてい ます。
VBA の基礎 (Visual Basic for Application) 国立教育政策研究所 坂谷内 勝.
コンピュータと情報 第10回 Excel を使ってみる. Excel の起動 ① 「スタート」ボタンをク リック ② すべてのプログラムにマ ウスカーソルをあわせる ③ 「 Microsoft Office 」 → 「 Microsoft Excel 2003 」 にマウスをあわせて,ク リック ④.
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
コーパス言語学実践 2006 年度 2 学期 第 7 回. 2 本日の内容 前回までのまとめ – ファイルの確認 – ファイルの分割 – エクセルでの作業(品詞構成比率 延べ語 数) 品詞構成比率(異なり語数) データ収集(占いのことば)
表計算ソフト (教科書49ペー ジ). ◎表計算ソフトとは 表から計算によって ① 知りたいデータを見つけ出し、 ② わかりやすく、見やすく加工する ことができるソフトのこと。
コンピュータ演習 Excel 入門 岡田孝・山下雅啓 Excel の機能は膨大 その中のごく一部を紹介 表計算機能 – データの入力、表の作成、計算など グラフ機能 – 棒グラフ、円グラフなどグラフ作成 データベース機能 – 並べ替え(ソート)、検索、抽出など マクロ機能 – VBA で自動化したマクロを作成可能.
シミュレーション論Ⅰ 第 7 回 待ち行列のシミュレーション(2). 第 6 回のレポート(解答例) 乱数表より乱数を記入し、到着間隔・サービス時間にした がってグラフを作成する 例) 最大待ち人数:2人 最大待ち時間:5分 平均待ち時間:3分.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
JMP version5(以上) 日本語版のScripting Languageによる プログラミング
初年次セミナー 第13回 2次元グラフィックス(1).
第2章補足 幹葉表示 統計学基礎 2010年度.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
ローレンツ曲線とジニ係数 度数分布表の応用 ローレンツ曲線の意味 ローレンツ曲線の作成 ジニ係数.
エクセル(1)の目次 起動法、ブック、シート、セル ブックの開き方 エクセル画面 マウスポインターの種類 シート数の調節 データの入力法
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
プログラミング入門 電卓番外編 ~エクセルで関数表示~.
全加算回路 A, Bはそれぞれ0または1をとるとする。 下位桁からの繰り上がりをC1とする。(0または1)
Excel による データベース入門 Ver /9.
統計学 第3回 「データの尺度・データの図示」
Microsoft Excel 2010 を利用した 2項分布の確率計算
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
エクセル(1)の目次 起動法、ブック、シート、セル ブックの開き方 エクセル画面 マウスポインターの種類 シート数の調節 データの入力法
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
統計解析 第9回 第9章 正規分布、第11章 理論分布.
エクセル(2)の目次 セル範囲の指定方法 データの消去法 アクティブセルの移動 セル内容の複写と移動 セル幅の変更方法
確率・統計Ⅱ 第7回.
第6章 2重ループ&配列 2重ループと配列をやります.
統計学 10/19 鈴木智也.
情報処理 第6回.
情報処理 第6回.
主成分分析                     結城  隆   .
統計解析 第1章 データの表現.
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
月曜3限 1141教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1141教室 担当者: 河田 正樹
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第9回:Microsoft Excel (1/2)
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
第10回:Microsoft Excel (2/2)
情報処理A 第?回 Excelを使ってみる.
ネットワーク理論 Text. Part 3 pp 最短路問題 pp 最大流問題 pp.85-94
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
2a グラフの用法.
デジタル画像とC言語.
プログラミング言語Ⅰ(実習を含む。), 計算機言語Ⅰ・計算機言語演習Ⅰ, 情報処理言語Ⅰ(実習を含む。)
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
analysis of survey data 堀 啓造
エクセル(2)の目次 セル範囲の指定方法 データの消去法 アクティブセルの移動 セル内容の複写と移動 セル幅の変更方法
第10回:Microsoft Excel (2/2)
クロス表とχ2検定.
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
プログラミング入門 電卓を作ろう・パートI!!.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
数理統計学  第6回 西山.
第2章 統計データの記述 データについての理解 度数分布表の作成.
ヒープソート.
都市・港湾経済学(総) 国民経済計算論(商)
Microsoft Excel 2010 を利用した 2項分布の確率計算
Molecular Devices Japan
第7章 そろそろ int 以外も使ってみよう! ~データ型 double , bool~
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

ヒストグラム 考え方と作り方 産業統計論 2004 年

量的変数で区分された相対度数 相対度数 下位集団の大きさを全集団に占める割合として示したもの 質的変数と量的変数 たとえば、男女別集計のような場合は、あるかないかどちらかである。 (どちらでも内を含めてもよい) これに対し、身長や体重、テストの点数、資産、所得などは、本来連 続しているか、または明白な区切りがない。 これを小集団の区切りに使うときには、区間幅が問題になる。 たとえば、20点の中に20パーセントが入っているということと、 10点の中に10パーセントが入っていることとは同じである。れを うまく表すように「密度」の概念で書いたものがヒストグラムである

密度の計算 相対頻度=頻度 / 全集団の大きさ 密度=相対頻度 / 区間幅 ここで、区間幅は厳密には相対幅(=区間幅 / 全区間幅)にした 方がよい。こうすると、全部の面積が1になり、「何かが起こ る確率は1」という定義に一致する。 面倒であればそのままの区間幅でも、できるヒストグラムの形 は同じである。 実際のデータでは多くの場合、大きい方の終点が定義されてい ない。常識を働かせて適当に決める。(身長なら200センチ、 年齢なら100歳等々)

法人企業統計から計算しよう もとの表に すでに相対 頻度は計算 されている が、原数値 から計算し ていこう。 ワークシー トをコピー して必要な ところを残 し、区間幅、 相対頻度、 密度を順に 計算してい く

区間幅は当該区間の下限と上位区間の下限の差から計算 区間最大値は日本一の巨大企業から適当にとる。 NTT 東西、トヨタを念頭に少し 小さくして5万人としておいた。 従って全区間幅は5万人、相対区間幅は当該区間の幅 /5 万となる。 ここでは検算していないが、相対区間幅 × 密度の総和が1になることも確かめられ る。 密度の計算まで

ヒストグラムを書く準備(1) 区間の幅が異なる棒グラ フを各機能はエクセルに はないので、一筆書きの 要領で、 x,y を指定して 散布図を線で結んだグラ フを書けばよい。 下限と密度を対応させた ものをまず準備する。 (なるべく、コピー& ペーストで作る)

ヒストグラムを書く準備(2) 最初の行はまっすぐ上に密度分のば すことを示す。 この前に原点( 0 、 0 )を挿入する。行 の挿入のあと、 x,y ともに 0 を入力。 これで原点から始まって密度分上に 上がるまでが完成 次に高さをそのままに区間の右端ま で平行に右に移す。まずもとの1行 のあとに行を挿入。区間右端は次の 区間の下限と同じなので、コピーか、 =[ セル指定 ] でx座標(従業員規模) を指定し、 y 座標はそのままの高さな ので、当該区間の密度を同じように =[ セル指定 ] で入力すればよい。 右はこうして最初の区間が完成した ところ。太字が挿入部分である。こ れを繰り返す。

ヒストグラムを書く準備( 3 ) もとの行と挿入行の区別に右の 列に * を最初に挿入しておくと便 利である。 右が完成したところ。みてわか るように最後をのぞいて一行ず つ挿入される。 右に移動する操作なので、 x は次 の行、 y はまえの行を指定する。 コピーよりセル指定の方があと でチェックするときなど便利で ある。 できあがりをみると、 x,y が入れ 替わりに変化していくのがわか る。 最後の行は、定義されていない 終点まで右にもってくるのがラ スト2行、下におろすのが最終 行である。

実際に書いてみると 教科書的な例ではこれでよいはずだが、下図のように、密度も規模も差がありすぎて、 見えない。 こうしたときは普通なら対数をとってみると見やすくなるが、見かけだけとはいえ、確 率密度がマイナスというのが気持ち悪いので今回は規模別にしてみよう。

小規模企業 従業員50人以下の企業のヒストグラム。確かにヒストグラムが書け ていることがわかる。 また、この程度の小企業の中でも、従業員10人以下のもっとも零細 な企業が圧倒的に多いことがわかる。

中規模以上 従業員 5000 人以上の巨大企業はきわめて少ないので、これがあるとほとんどわ からなくなるので、 5000 人未満までである。 ここでも規模が大きい企業が極めて急速に少なくなる様子がよくわかる。