「測定(measurement)について」

Slides:



Advertisements
Similar presentations
はじめてのパターン認識 第1章 第4グループ 平田翔暉. パターン認識 パターン認識 o 観測されたパターンを、あらかじめ定められ たクラスに分類すること クラス o 硬貨: 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット: 26 種類 o 数字:
Advertisements

の範囲に、 “ 真の値 ” が入っている可能性が約 60% 以上ある事を意味する。 (測定回数 n が増せばこの可能性は増 す。) 平均値 偶然誤差によ るばらつき v i は 測定値と平均値の差 で残差、 また、 σ は、標準誤差( Standard Error, SE ) もしくは、平均値の標準偏差、平均値の平均二乗.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
研修のめあて 授業記録、授業評価等に役立てるためのICT活用について理解し、ディジタルカメラ又はビデオカメラのデータ整理の方法について研修します。 福岡県教育センター 教員のICT授業活用力向上研修システム.
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
心理学基礎論 4月14日 感覚・知覚① 感覚の測定.
論文紹介 青年期における恋愛相手の選択基準とアイデンティティ発達との関係
コメント 「ファセット・アプローチの 魅力とパワー」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成.
パレスチナ人の越境移動に関する意識と経験
周育佳 東京外国語大学地域文化研究科博士後期課程
統計学 第3回 「データの尺度・データの図示」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
コメント 狩野 裕 大阪大学人間科学部 日本心理学会ワークショップ 「探索的因子分析における変数の選択(3)」
5因子性格モデルによる 性格特性とプライベート空間
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
疫学概論 メタアナリシス Lesson 21. 健康政策と疫学 §D. メタアナリシス S.Harano, MD,PhD,MPH.
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
研修1 組織の規範について 東京コンサル株式会社 担当:事変.
1DS04168E 梅根綾花 1DS04184E 清 泰裕 1DS04197P 福井千尋
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
総合科目「学生による授業評価 アンケート」(マークシート方式)
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
小学校における英語指導は、中学校での英語学習にどのような影響を与えるか?
マーケティング・リサーチ.
統計リテラシー教育における 携帯端末の利用
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
総合科目「学生による授業評価 アンケート」(マークシート方式)
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
12月4日 伊藤 早紀 重回帰分析.
成績は、小テストと期末のレポートによって評価 (1/3以上欠席の場合は不可とします)
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
疫学概論 測定の信頼性 Lesson 20. 評価の要件 §B. 測定の信頼性 S.Harano, MD,PhD,MPH.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成.
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
調査の企画(1):質問紙の作成プロセス 1.質問紙の構成 2.質問紙の作成手順 3.質問紙を作成する際に注意する点 4.課題
妥当性概念の展開 日本学術振興会・東京工業大学 村山 航.
東京工科大学 コンピュータサイエンス学部 亀田弘之
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
疫学概論 測定の信頼性 Lesson 20. 評価の要件 §B. 測定の信頼性 S.Harano, MD,PhD,MPH.
再討論 狩野裕 (大阪大学人間科学部).
統計学の入門講義における 達成動機,自己効力感,およびテスト成績の関連
analysis of survey data 堀 啓造
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第6章 性格とは何か?.
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
疫学概論 測定の妥当性 Lesson 20. 評価の要件 §A. 測定の妥当性 S.Harano, MD,PhD,MPH.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第5章 性格とは何か?.
テキスト理解,論点設定, 論述のスキルを高める アクティブ・ラーニング
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
回帰分析入門 経済データ解析 2011年度.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
確率と統計 年1月7日(木) Version 3.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成.
Presentation transcript:

「測定(measurement)について」 MHB研究会 リサーチ・メソッド学習会 (Nov 6, 2010) 「測定(measurement)について」 京都ノートルダム女子大学 小山哲春 tkoyama@notredame.ac.jp

Topics to be covered 1. 心理測定法(psychometrics) 2. 尺度(scale)の水準と種類 データと測定値 測定値と誤差(error) 変数(variable) 構成概念(construct)、観測変数(observed variable)、潜 在変数(latent variable) 計測のプロセス 2. 尺度(scale)の水準と種類 尺度の水準 尺度の種類 3. 信頼性(reliability)と妥当性(validity) 信頼性の定義、種類、確認法

近代科学の方法論 データ(を集める)とは? 観察とは? データ 帰納 法則 演繹 検証 データ データ 観察 分析 理論 仮説 検証 (反証) データ データ 観察 分析 (統計) 理論 仮説 検証 仮説生成型(探索的)研究 仮説検証型(実験的)研究 データ(を集める)とは? 観察とは?

1. 心理測定法(psychometrics) 1.1 データとは? datum ← ラテン語で「所与のもの」 (dare = to give; datum = the given) data = 客観的事実? data = 観測(測定)値

1.2 測定値と誤差 心理的「何か」を計測するとき、測定値を構成 するのは以下のような要素である: 測定値 真の値 誤差 (error) 系統誤差 (systematic error) 神様にしか見えない!! 無作為誤差 (random error)

真の値 無作為誤差(random error) 本来計測したいもの 実際に得られた値(観測値)ができるだけ真 の値に近いものであるのが理想的 偶発的/予想不可能/不可避 サンプルサイズが十分に大きければ相殺さ れる(cancel out)

(Systematic error / Measurement error) 系統誤差 (Systematic error / Measurement error) 計測に規則的に影響する要因によって生じ る誤差 バイアスであり、相殺されない 例:  I.Q.テストにおける文化バイアス 暑さで伸びた鉄製の定規 担当教員が手渡して目の前で回答させる授業評価アンケート

Systematic Errors 反応効果(Reactive Measurement Effect) 計測のプロセスが回答者の反応に英旧王を及 ぼす 調査環境 (私的/公的調査、無償/有償、等) 調査者(性別等の特性、調査への認識、等) 社会的望ましさの効果(Social Desirability Effect) 調査の対象となっていることを意識し、「社会的 に望ましい」と考えられる回答をしたり、「良い /適切な」行動をとったりする

1.3 変数 では、何を計測するのか? 変数: 対象によって値が変化するもの(吉田1998, p.7) 男 35歳 176cm 日本語 760点 活発 2点 変数 :性別: :年齢: :身長: :母語: :TOEIC: :性格: :議論能力: 値 女 29歳 162cm 英語 985点 温厚 5点 Unit of Analysis Unit of Analysis

1.4 構成概念と観測変数 全ての変数が観察可能か? 社会科学で対象となる多くの変数(概念)は直 接には観察不可能: 語学その他の能力 心理概念(信念、態度、動機、指向性、等) 理論的に概念化する:構成概念(construct) 観察はできないので「潜在変数(latent variable)」 と呼ぶ(vs. 観察変数(observed variable)

「構成概念」(潜在変数)は計測不可能なの か? 特別にあつらえた「モノサシ」を用いて(間接 的に)測定することは可能 心理測定法(psychometrics) 実際に計測可能な「観測変数」を用いて測定

数学の能力 問題1 問題2 問題3 計算能力 問題1 問題2 問題3 文章題能力 問題1 問題2 問題3 証明能力 構成概念 (潜在変数) 観測変数 (小塩・西口(2007), p.6 より)

計測したい概念 項目1 項目2 項目3 下位概念1 下位尺度1 項目1 項目2 項目3 下位概念2 下位尺度2 項目1 項目2 項目3 下位概念3 下位尺度3 構成概念 質問紙(尺度) (小塩・西口(2007), p.7 より)

1.5. 心理測定のプロセス 概念化 (Conceptualization) 操作化 (Operationalization) 尺度作成 (Compose measures) 測定 (Measure)

操作化(Operationalization) Verbal report / Self-report / Questionnaire In survey research Observational measurement In field research Combination of both In experimental research Archival record In available data research

2. 尺度の水準と種類 尺度の水準 尺度の種類 名義、順序、間隔、比率 評定尺度法 自由記述法 リカート法(Likert Scale) SD法 (Semantic Differential Scale) 多肢選択法 順位法 自由記述法

名義尺度 質的データ / カテゴリ-データ 同種のものに同じ数値を割り当てる 数値は等価性を表すだけであり、大小関係を意 味しない。計算不能。 性別 (1 Female, 2 Male) 支持政党 (1 Democrat, 2 Republican, 3 Independent, 4 Other, etc.) 人種、文化、母語、等々

(2) 順序尺度 量的出た 各対象に割り当てられた数値が測定値間の大 小関係のみを表す 順位 加減乗除の演算はできない 1st, 2nd, and 3rd place in a race ESPN/USA Today Top 25 Coaches Poll

(4) 比率尺度 (Ratio Scale) 量的データ 等間隔性 原点0が一義的に定まっている 加減乗除の演算が可能 例: 尺度: 体重計、ストップウォッチ、物差し データ: 収入、年齢、時間(日数等)

(3) 間隔尺度 量的データ 測定対象における何らかの量の差の大きさを、測定 値間の数値の大きさとして表す。 原点は任意に定められ、絶対0は存在しない。 マイナス値も可能: 1~5 /‐2 ~ ‐4 厳密には測定値間の倍数関係を問題にすることは できない 乗除の演算は不可 平均点の計算は可 例: 摂氏、華氏の温度計 ほとんどの心理尺度 尺度の単位(間隔)が一定であることが保証されてい なければ、順位尺度/名義尺度としてしか扱えな い!!!

厳密には間隔尺度でない例 以下の最も当てはまる選択肢を選んで下さい。 まったくあてはまらない あまりあてはまらない どちらともいえない ややあてはまる とてもよくあてはまる 1.湯川先生のことを尊敬している。 ( ) ( ) 2.湯川先生はとても厳しい。 3.湯川先生は今日もお綺麗だ。

間隔尺度(と見なせる)例 以下の項目に1~5で回答して下さい。 まったくあてはまらない あまりあてはまらない どちらともいえない ややあてはまる とてもよくあてはまる 1.湯川先生のことを尊敬している。 1 2 3 4 5 2.湯川先生はとても厳しい。 3.湯川先生は今日もお綺麗だ。

間隔尺度ではない例 間隔 間隔 ? 以下の項目に1~5で回答して下さい。 全くそう思わない そうは思わない 分からない そう思う 強くそう思う 1.湯川先生のことを尊敬している。 1 2 3 4 5 2.湯川先生はとても厳しい。 3.湯川先生は今日もお綺麗だ。 間隔 間隔 ?

Levels of Measurement Identity Order Equal Distance True Zero Nominal ○ Ordinal Interval Ratio

2.2 尺度の種類 もっとも一般的な間隔尺度 リカート法(Likert Scale) ある構成概念(潜在変数)を測定していると考えられる項目(観測変数)を複数提示し、同じ選択肢を用いて回答を求める。 SD法(Semantic Differential Scale) 主にあるものの印象やイメージを測定する方法で、複数の形容詞対(良い‐悪い/明るい‐暗い)を提示して、その対象がどちらに近いかを回答してもらう。

Likert Scale 湯川先生に関して、以下の項目に1~5で回答して下さい。 まったくあてはまらない あまりあてはまらない どちらともいえない ややあてはまる とてもよくあてはまる 1.湯川先生のことを尊敬している。 1 2 3 4 5 2.湯川先生にならどこまでも   ついていく。 3.湯川先生の仰ることに従っていれば   間違いはない。 (湯川先生への「傾倒度」)

SD Scale 優しい 1 2 3 4 5 6 7 冷たい 重厚である 1 2 3 4 5 6 7 軽薄である 「湯川先生」のイメージを思い浮かべ、以下の形容詞対がどれくらい当てはまるかを1から7の中から1つ選んで○をつけて下さい: 優しい 1 2 3 4 5 6 7 冷たい 重厚である 1 2 3 4 5 6 7 軽薄である 明るい 1 2 3 4 5 6 7 暗い 厳格である 1 2 3 4 5 6 7 いい加減だ

多肢選択法 → 名義尺度(カテゴリー) 順位法 → 順位尺度(順序づけ) 自由記述法

3. 信頼性(reliability)と 妥当性(validity) 測定で最も重要なこと: 測定したい対象を、  ①安定して誤差なく測れているのか?          信頼性(reliability)  ②(真の値を)的確に正しく測れているのか? 妥当性(validity)

Reliability and Validity Objective ways to evaluate the quality of measurement (operational definitions). Reliability: Stability and Consistency of the measurement The extent to which it is free from random error Validity: Accuracy: Extent of matching, congruence, or “goodness of fit” b/w an operational definition & the concept being measured. (Stangor, 1998)

信頼性あり 妥当性なし 信頼性あり 妥当性なし 信頼性あり 妥当性あり 信頼性なし 妥当性なし

信頼性 測定の無作為誤差(random error)が少ないこと 尺度の内的整合性があること 短時間で(回答が)変化しないこと 誤差を招く要因: 曖昧な語句等は無作為誤差を招く 誘導的な語句、文化的/社会的な価値観を表す語句、感情的な語句などは系統誤差を招く→妥当性の問題 長さ: 鉄製の定規 vs. 布製の定規 温度: 温度計 vs. 人間の感覚 尺度の内的整合性があること 1つの尺度に含まれる項目が同じ方向性を示して いること:全ての質問項目が基本的には同じ対象 を計測していること 異質な質問項目→(尺度全体の値に)無作為誤差を招く

信頼性の評価 無作為誤差の評価 内的整合性の評価 再検査法 (Test-retest Reliability) Test-retest Equivalent Forms 内的整合性の評価 折半法(Split half method) 信頼性係数クロンバックα (Coefficient Alpha) Item-to-Total Correlations 評価者内/評価者間信頼性(Intercoder (Interrater) Reliability) Coefficient Alpha: quantitative variables Kappa (k): qualitative variables

妥当性 「本当に見たいものを観測できているか どうか」 潜在変数を測定する場合「直接観察はで きないので」慎重な検討が必要 「愛情」の計測: 「花をあげる回数」 「愛していますか?」という質問への回答 SD法による質問項目への回答 Likert法による質問項目への回答 3項目の場合 vs. 5項目の場合

妥当性の種類 表面妥当性 (face validity) 内容妥当性 (content validity) 構成概念妥当性 (construct validity) 収束妥当性 (Convergent Validity) 弁別妥当性 (Discriminant Validity) 基準関連妥当性 (criterion validity) 予測可能性 (Predictive Validity) 並存的妥当性 (Concurrent Validity)

妥当性の種類 表面妥当性 (face validity) 内容妥当性 (content validity) 何を測定しているように見えるか? 専門家、および一般の人間としての判断 内容妥当性 (content validity) 操作化に際し、当該の概念が及ぶ全ての面が網羅されているかの判断 下位尺度の数 3項目尺度 vs. 7項目尺度

妥当性の種類 構成概念妥当性 (construct validity) 基準関連妥当性 (criterion validity) 収束妥当性 (Convergent Validity): 同じ概念の計測結果は相関するはず 弁別妥当性 (Discriminant Validity): 別の概念の計測結果は相関しないはず Differences among known groups 同じ特性を持っている別集団の計測結果は相関するはず 基準関連妥当性 (criterion validity) 予測可能性 (Predictive Validity) 並存的妥当性 (Concurrent Validity)

多特性・多方法 (Maultitraits-Multimethods: MTMM) Campbell & Fiske (1959) 計測の方法が異なっても同一概念を測 定する場合には相関が高くなる 別の概念を測定する場合には相関が高 くなってはならない

(Maultitraits-Multimethods: MTMM)      特性 方法1 方法2 A B (1) (3) (2) (4) (1) 信頼性係数(アルファ) (3) 弁別妥当性(同一方法・異特性) (2) 収束妥当性(異方法・同一特性) (4) 異方法・異特性測定 妥当性: (1) > (2) > (3) > (4)

まとめ? 質問紙調査は必ずしも「真の世界」の 観測ではない 「構成概念」は理論的概念である 「構成概念」は観察が難しい 信頼性と妥当性を高めることで、より 正確でより安定した「構成概念」の観 察を心がける必要あり

参考文献 Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by the multitrait-multimethod matrix. Psychological Bulletin, 56, 81-105. Stangor, C. (1998). Research Methods for the Behavioral Sciences. Boston, MA: Houghton Mifflin. [参考図書] 浦上昌則・脇田貴文. (2008). 『心理学・社会科学研究のための調査系論文の読 み方』. 東京図書. 三浦省吾(監修).(2004). 『英語教師のための教育データ分析入門』. 大修館書店. 小塩真司. (2004).『SPSSとAMOSによる心理・調査データ解析』. 東京図書. 小塩真司・西口利文. (2007). 『質問紙調査の手順』. ナカニシヤ出版. 小野寺孝義・菱村豊. (2005). 『文科系学生のための新統計学』. ナカニシヤ出版. 吉田寿夫. (1998). 『本当にわかりやすいすごく大切なことが書いてあるごく初歩の 統計の本』. 北大路書房. 森敏昭・吉田寿夫. (1990). 『心理学のためのデータ解析テクニカルブック』.