第１日目第２時限の学習目標基本的な１変量統計量（その２）について学ぶ。尺度水準と適切な統計量との関連を整理する。

Slides:

Advertisements

Similar presentations

5 章標本と統計量の分布湯浅直弘. 5-1 母集団と標本 ■ 母集合今までは確率的なことこれからは，確率や割合がわかっていないときに，推定することが目標．個体：実験や観測を行う 1 つの対象母集団：個体全部の集合  ・有限な場合：有限母集合 → １つの箱に入っているねじ．  ・無限な場合：無限母集合.

Advertisements

1 章データの整理 1.1 データの代表値. ■ 母集団と標本観測個数 n ( または標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本または全数調査 (census) 母集団 (population) 知りたい全体標本 (sample) 入手した情報.

Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布釣り鐘形の曲線－∽から＋ ∽までの値を取る平均 mean ＝中央値 median ＝最頻値 mode 曲線より下の面積は１に等しい.

1 変量データの記述（度数分布表とヒストグラム）経済データ解析 2009 年度後期. あるクラスのテストの点数が次のようになっていたとする。このように出席番号と点数が並んでいるものだけでは、このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.

Advanced Data Analysis 先進的データ分析法 2015 （２）平成 27 年前期第１クウォータ科目東京工科大学大学院バイオニクス・情報メディア学専攻科担当：亀田弘之.

社会福祉調査論第 8 講統計の基本的整理 12 月７日. 【目標】量的調査の集計方法、結果の示し方について、基礎的な手法を習得する。統計値を捉えるための諸指標を理解する。

生物統計学・第 4 回比べる準備をする平均、分散、標準偏差、標準誤差、標準化 2015 年 10 月 20 日生命環境科学域応用生命科学類尾形善之.

中学校段階での相関関係の指導宮崎大学教育文化学部藤井良宜. 概要現在の学習指導要領における統計の扱いこれまでの相関関係の指導相関関係の指導のポイント相関関係.

1 統計学第２週 10/01 （月）担当：鈴木智也. 2 前回のポイント「記述統計」と「推測統計」。データ自体の規則性を記述するのが「記述統計」、データを生み出した背景を推測するのが「推測統計」である。推測統計は記述統計に基づくので、まずは記述統計から学ぶ。以下、データの観測値をＸ.

エクセルと SPSS によるデータ分析の方法社会調査法・実習資料. 仮説の分析に使う代表的なモデル１クロス表２ｔ検定（平均値の差の検定）３相関係数.

データ解析基礎 2. 度数分布と特性値 keyword データの要約度数分布表，ヒストグラム分布の中心を表す基本統計量

統計解析第3章散布度.

寺尾敦青山学院大学社会情報学部 R での連関測度の計算方法寺尾　敦青山学院大学社会情報学部

第1章記述統計の復習統計学　2007年度.

確率･統計Ⅰ 第12回統計学の基礎1 ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

多変量解析　－重回帰分析－発表者：時田　陽一発表日：11月20日.

第3章　2変量データの記述統計学基礎　2010年度.

実証分析の手順経済データ解析　2011年度.

統計学第3回「データの尺度・データの図示」

市場調査の手順問題の設定調査方法の決定データ収集方法の決定データ収集の実行データ分析と解釈データ入力データ分析報告書の作成.

代表値と散らばり.

標本の記述統計専修大学　経済学部経済統計学（作間逸雄）.

第1章記述統計の復習統計学　2010年度.

第４回 (10/16) 授業の学習目標先輩の卒論の調査に協力する。２つの定量的変数間の関係を調べる最も簡単な方法は？

心理統計学 II 第７回 (11/13) 授業の学習目標相関係数のまとめと具体的な計算例の復習相関係数の実習.

流れ（3時間分）１ちらばりは必要か？２分散・標準偏差の意味３計算演習（例題と問題）４実験１（きれいな山型の性質を知ろう）

確率･統計Ⅱ 第7回.

臨床統計入門（３）箕面市立病院小児科　　山本威久平成２３年１２月１３日.

統計学第３回　10/11 担当：鈴木智也.

統計学 10/19 鈴木智也.

第４日目第２時限の学習目標検査（テスト）の信頼性について学ぶ。（１）検査得点の構成について知る。（２）検査の信頼性の定義を知る。

正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定

統計リテラシー育成のための数学の指導方法に関する実践的研究

1変量データの記述経済データ解析　2006年度.

市場調査の手順問題の設定調査方法の決定データ収集方法の決定データ収集の実行データ分析と解釈データ入力データ分析報告書の作成.

心理統計学 II 第８回（11/20) 授業の目標相関係数の検定のWEB宿題のやり方

看護研究における統計の活用法 Part １京都府立医科大学　浅野　弘明 2012年11月10日.

第２日目第４時限の学習目標平均値の差の検定について学ぶ。（１）平均値の差の検定の具体例を知る。

第４日目第３時限の学習目標検査の信頼性（続き）を学ぶ。妥当性について学ぶ。（１）構成概念妥当性とは？（２）内容妥当性とは？

第８回授業（5/29日）の学習目標検定と推定は、１つの関係式の見方の違いであることを学ぶ。第３章のWEB宿題の説明

代表値とは散布度とは分布のパラメータ母集団とサンプル

第１1回授業(12/11)の学習目標第８章分散分析 (ANOVA) の学習分散分析の例からその目的を理解する分散分析の各種のデザイン

第１日目第１時限の学習目標平成２２年度「教育統計」の学習内容の概要を知る。尺度の４水準の例とそれらの特色の概要を学ぶ。

第２日目第１時限の学習目標順列、組み合わせ、確率の入門的知識を学ぶ。（１）順列とは？（２）組み合わせとは？（３）確率とは？

第１０回授業（12/4)の目標カイ２乗検定の実習 WEB を用いたカイ２乗検定と、授業で行った検定結果の正誤の確認方法（宿題）

秋期第1回（9/25）授業の目標授業五か条の再確認をする。秋期の心理統計学の学習内容を知る。２、３の注意事項を確認する。

中澤港統計学第４回中澤　港

他の平均値幾何平均調和平均メデイアンとモード平均値・メデイアン・モードの関係.

確率と統計メディア学部２００8年後期 No.3 平成20年10月16日（木）.

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

第１日目第３時限の学習目標２変量データを手にした時の分布の特徴の記述方法（前回からの続き）について学ぶ。基本的な２変量統計量ー１

analysis of survey data 堀啓造

第１２回授業（12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法（宿題）

データの型量的データ質的データ数字で表現されるデータ身長、年収、得点カテゴリで表現されるデータ性別、職種、学歴

「アルゴリズムとプログラム」結果を統計的に正しく判断三学期第7回袖高の生徒ってどうよ調査(3)

都市・港湾経済学（総）国民経済計算論（商）

代表値と散らばり.

度数分布表における平均・分散（第1章記述統計の復習補足）

情報の集約記述統計記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。

第３日目第４時限の学習目標第１日目第３時限のスライドによる、名義尺度２変数間の連関のカイ２乗統計量についての復習

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

1変量データの記述（度数分布表とヒストグラム）

臨床統計入門（１）箕面市立病院小児科　　山本威久平成２３年１０月１１日.

第2章統計データの記述データについての理解度数分布表の作成.

回帰分析入門経済データ解析　2011年度.

統計現象高嶋　隆一 6/26/2019.

第４日目第２時限の学習目標検査（テスト）の信頼性について学ぶ。（１）検査得点の構成について知る。（２）検査の信頼性の定義を知る。

第１日目第１時限の学習目標平成２１年度「教育統計」の学習内容の概要を知る。尺度の４水準の例とそれらの特色の概要を学ぶ。

第１日目第２時限の学習目標基本的な１変量統計量（その２）について学ぶ。尺度水準と適切な統計量との関連を整理する。

Presentation transcript:

第１日目第２時限の学習目標基本的な１変量統計量（その２）について学ぶ。尺度水準と適切な統計量との関連を整理する。２変量データを手にした時の分布の特徴の記述方法について学ぶ。基本的な２変量統計量ー１　　　　　　　　　カイ２乗統計量について学ぶ。

基本的な１変量統計量ー２ (a) 中央値、四分領域中央値ーデータを小さい順に並べたとき、中央（５０パーセント点）にくる値のこと。第１四分位数ーデータを小さい順から大きい順に並べたとき、下から４分の１（２５パーセント点）にくる値のこと。第３四分位数ーデータを小さい順から大きい順に並べたとき、下から４分の３（７５パーセント点）にくる値のこと。四分領域ーデータを小さい順に並べたとき、第３四分位数と第１四分位数の差の半分の値のこと。

基本的な１変量統計量ー２ (b) 四分位数と四分領域 Q の関係 Q = (Q3-Q1)/2 ２５％２５％２５％２５％ Q1 Mdn Q3

基本的な１変量統計量ー２ (c) 中央値 (Median) の求め方中央値の求め方は、「心理統計学 a」のテキストの p.17 の (4.1) 式の通りである。すなわち、 •　ここで、lm は、中央値のある階級の下限点、 •　h は、階級の幅、 •　cum (lm) は、中央値のある階級より１つ手前までの　累積度数、 •　fm は、中央値のある階級の度数

基本的な１変量統計量ー２ (d)第１四分位数の求め方第１四分位数の求め方は、「心理統計学 a」のテキストの p.17 の (4.2) 式の通りである。すなわち、 •　ここで、lQ1 は、第１四分位数のある階級の下限点、 •　h は、階級の幅、 •　cum (lQ1) は、第１四分位数のある階級より１つ手前　　までの累積度数、 •　fQ1 は、第１四分位数のある階級の度数

基本的な１変量統計量ー２ (e) 第３四分位数の求め方第３四分位数の求め方は、「心理統計学 a」のテキストの p.17 の (4.3) 式の通りである。すなわち、 •　ここで、lQ3 は、第３四分位数のある階級の下限点、 •　h は、階級の幅、 •　cum (lQ3) は、第３四分位数のある階級より１つ手前　　までの累積度数、 •　fQ3 は、第３四分位数のある階級の度数

基本的な１変量統計量ー２ (f) 四分領域の求め方これらにより、中央値 (Mdn)、第１四分位数 (Q1)、第３四分位数 (Q3) が求まったならば、テキスト p.16 の下方の公式により、として、四分領域 (Q) を求めればよい。

基本的な１変量統計量ー２ (g) 最頻値（mode）最頻値ー得られる確率が最も高い値、もしくは得えられる頻度の最も多い値。右の図では、２つの山のうちの右側に対応するｘの値 (mode と　表記）。 x mode

基本的な１変量統計量ー２ (h) 中央値、四分領域、最頻値の性質中央値、四分領域は、順序情報以上の尺度レベルのデータでは計算可能である。なぜ？最頻値は、名義尺度、順序尺度、間隔尺度、比率尺度のいずれのレベルのデータでも計算可能である。なぜ？

基本的な１変量統計量ー２まとめこれまでに学んだ基本的な１変量統計量の代表的な幾つかを尺度水準との関連でまとめると右の図のようになる。基本的な１変量統計量ー２　　　　　　まとめこれまでに学んだ基本的な１変量統計量の代表的な幾つかを尺度水準との関連でまとめると右の図のようになる。順序尺度間隔尺度・比率尺度代表値中央値　(Mdn) 　平均ばらつき四分位数　　　(Q) 標準偏差（分散）

２変量データを手にした時の分布の特徴の記述－１２変量データを手にした時の　　　　　　　分布の特徴の記述－１何らかの目的で N 対の対データ（２変量データ）　を手にしたとする。サンプル数 N がある程度以上大きい場合、簡単にデータの全体像をつかむためには、データが原則的に名義尺度レベルの場合はまず分割表を、順序尺度レベル以上であれば散布図を描けばよい。

２変量データを手にした時の分布の特徴の記述－２２変量データを手にした時の　　　　　　　分布の特徴の記述－２分割表とは、例えば５１４名の被験者を（行と列の）２つの属性を用いて、右のように分類したものである。厳しすぎ適当もっと厳しく　男　２７２７５　７５　女　　３１２４　１０

データの内容ー１上記データは、新入生に対する永平寺参禅時の５１４名の学生に対する、参禅後の調査データを２つの属性で分類したものである。属性の１つは学生の性別（男子、女子）であり、他方は永平寺の雲水による坐禅指導の評価（厳しすぎた、適当、もっと厳しく）である。

データの内容ー２もとのデータは、上記２変量の対（ｘ、ｙ）が、（性別、座禅指導の評価）、から成る、一対のデータ、５１４名分である。　　　　　　（性別、座禅指導の評価）、　から成る、一対のデータ、５１４名分である。（２，２）、（２，３）、（１，２）、… 、（１，２）これらを、うえの表のようにまとめたものは、分割表または、クロス表と呼ばれる。

分割表（又はクロス表）の作り方データ（２，２）、（２，３）、（１，２）、… 、（１，２） 1.厳し過ぎた 2. 適当 3.もっとデータ　（２，２）、（２，３）、（１，２）、… 、（１，２） 1.厳し　過ぎた 2.　適当 3.もっと　　厳しく　　計 1.男子　　学生 2.女子

　　　　　　　演習（２）次の２０対（２０名）の２変量データセットの１つを用いて、２×２分割表を作成せよ。ここで、（x、y）変量のうち、前者は性別を後者は向性（外向、内向）を表すものとする：　　（データセット１）：　　　　　（１，１）、（２，２）、（１，２）、（１，１）、（２，１）、　　　　　（１，１）、（２，１）、（２，１）、（１，１）、（２，２）、　　　　　（１，２）、（１，２）、（１，１）、（１，２）、（２，１）、　　　　　（１，２）、（１，１）、（１，１）、（１，２）、（１，２）

　　　　演習（２）の続き（データセット２）：（２，１）、（２，２）、（２，１）、（１，１）、（２，１）、（１，１）、（２，２）、（２，１）、（１，２）、（１，２）、（１，２）、（１，２）、（１，２）、（１，２）、（２，１）、（２，２）、（２，２）、（１，２）、（１，２）、（２，１）

２変量データを手にした時の分布の特徴の記述－３２変量データを手にした時の　　　　　　　分布の特徴の記述－３散布図とは、例えば、千野のホームページの講義ノートの中の「データ解析/基礎と応用」の１．２．３節　「はずれ値の相関係数への影響」の項にあるような図である。

２変量データを手にした時の分布の特徴の記述－４２変量データを手にした時の　　　　　　　分布の特徴の記述－４データが名義尺度レベルの場合には、うえで紹介した分割表（クロス表）をもとに、２変量間の連関を表すための以下のような多くの指標がある。それらは、例えば、統計学辞典（東洋経済、１９８９、pp.341-343）を見ると、以下のように各種の指標がこれまでに提案されていることがわかる：

２変量データを手にした時の分布の特徴の記述－５２変量データを手にした時の　　　　　　　分布の特徴の記述－５それらは、　（１）カイ２乗統計量系指標（ピアソンのカイ２乗統計量、　　　クラメールのV、チュプロウの T、ピアソンの一致係数 C、尤度比カイ２乗統計量）　（２）予測関連指標（グッドマン・クラスカルの予測関連　　　　指数）　（３）その他、ヘイズの不確実性係数、コーエンの一致　　　係数など。

２変量データを手にした時の分布の特徴の記述－６２変量データを手にした時の　　　　　　　分布の特徴の記述－６一方、データが順序尺度レベルの場合には、２変量間の順位相関・関連係数を表すための以下のような多くの指標がある。例えば統計学辞典（東洋経済、１９８９、pp.338-340）。それらは、　（１）ケンドールの順位相関係数　（２）スピアマンの順位相関係数　（３）ソマーズの関連指数、その他　である。

２変量データを手にした時の分布の特徴の記述－７２変量データを手にした時の　　　　　　　分布の特徴の記述－７最後に、データが間隔尺度レベルの場合には、２変量間の相関関係を表すための以下のような指標がある。例えば統計学辞典（東洋経済、１９８９、pp.334-337）を見ると、それらは、　（１）共分散　（２）ピアソンの（偏差積率）相関係数　（３）偏相関係数、重相関係数、偏回帰係数、その他　である。

２変量データを手にした時の分布の特徴の記述－８２変量データを手にした時の　　　　　　　分布の特徴の記述－８この授業では、これらのうち、　　（１）名義尺度レベルの対データの場合の代表的な連関の関連性の検討のための統計量であるピアソンのカイ２乗統計量と、　　（２）間隔尺度レベル以上の対データの場合の代表的な２変量間の関連性の指標である共分散及び相関係数についてのみ、簡単に触れる。