第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。 (3)検査得点に対する仮定を知る。 (4)検査の信頼性の別表現を知る。 (5)信頼性係数と信頼性指数の違いを知る。 (6)その他の信頼性(係数)の求め方を学ぶ。
(検査)テスト得点の一般的な定義 最初に、テスト理論では、一般にテストの得点 Xiは、その真値 Ti と測定誤差 Ei を用いてつぎのように表される:
テスト得点の分散の分割 ここで、もし真値 Ti と誤差項 Ei が互いに独立ならば、T と E は無相関(共分散がゼロ)となり、
検査(テスト)の信頼性の定義とは? 2つの平行テスト X, Y 間の相関係数 ρXY を、信頼性係数と呼ぶ。 これにより信頼性を求める方法は、平行検査法と呼ばれる。 平行検査法では、同一被験者に等質なテストを2時点で行わせる。 平行テストとは、つぎのような性質を持ったテストとして定義される:
2つの検査(テスト)の定義 まず、2つの検査を、 Xi(u) , Xi(v) とすると、
平行性の概念-(1)平行測定 平行測定 2つの検査が平行測定 (parallel measure- ment) であるとは、 すなわち、
平行測定の意味 2つの検査が平行(測定)とは、 (1)両検査は、同一の特性を測定 していること、 (2)両検査は、同一の精度を有し (1)両検査は、同一の特性を測定 していること、 (2)両検査は、同一の精度を有し ていること、 を意味する。これに対して、
その他の平行性の概念ー本質的 τ 等価測定 ここで、cuv は定数である。 本質的 τ 等価測定 その他の平行性の概念ー本質的 τ 等価測定 本質的 τ 等価測定 2つの検査が本質的 τ 等価測定 (essentially τ- equivalent measurement) であるとは、 ここで、cuv は定数である。
平行検査(テスト)とは -平行検査(テスト)の条件 平行検査(テスト)とは -平行検査(テスト)の条件 両検査(テスト)が平行検査(テスト)であれば、つぎの条件を満たす:
平行検査とは ー平行検査間の相関係数-1 この時、Xu と Xv の相関係数 は、
平行検査とは-2 平行検査間の相関係数-2 ここで、先ほどの平行検査の満たすべき条件 を考慮すると、上記両検査間の相関係数 平行検査とは-2 平行検査間の相関係数-2 ここで、先ほどの平行検査の満たすべき条件 を考慮すると、上記両検査間の相関係数 は、つぎのように書ける:
検査の信頼性(係数)のまとめ 元来、2つの平行性検査間の相関係数として定義される、検査の信頼性(係数)は、当該検査得点 X の分散 V(X) と真値の分散 V(T) を用いて、つぎのように書ける:
検査の信頼性のもう1つの表現-1 上記の検査の信頼性(係数)は、既に紹介した検査得点の分割、すなわち v(X)=V(T)+V(E) を用いると、つぎのようにも書ける:
検査の信頼性のもう1つの表現-2 すなわち、検査の信頼性は、検査の誤差分散 V(E) と、測定値(検査得点)の分散 V(X) の言葉でも表現できることがわかる:
検査の信頼性(係数)と 信頼性指数-1 検査得点 X とその真値 T との共分散 Cov (X, T) が、 検査の信頼性(係数)と 信頼性指数-1 検査得点 X とその真値 T との共分散 Cov (X, T) が、 Cov (X, T)= Cov (T+E, T) = V(T) と書けることに注意すると、X と T の相関係数 ρXT は、
検査の信頼性(係数)と 信頼性指数-2 すなわち、 ここで、ρXT は、検査の信頼性指数 検査の信頼性(係数)と 信頼性指数-2 すなわち、 ここで、ρXT は、検査の信頼性指数 (index of reliability) と呼ばれる。この指数と、信頼性(係数)の区別が重要である。
信頼性(係数)と 信頼性指数との関係 言い換えれば、 (1)検査得点とその真値の相関係数 は、信頼性指数と呼ばれる。 信頼性(係数)と 信頼性指数との関係 言い換えれば、 (1)検査得点とその真値の相関係数 は、信頼性指数と呼ばれる。 (2)検査の信頼性指数の二乗は、信 頼性(係数)に等しい。
平行検査法の特徴と問題点 同一被験者に対して、同質な(平行テストの意味)検査(テスト)を、2時点で行う。 しかし、平行テストの意味で同質な検査を作成することは、大変難しい。 そこで、検査の信頼性(係数)を求めるには、平行検査法以外の方法を用いることが多い。
その他の信頼性係数の求め方 (1)平行検査法 これまでに紹介した信頼性係数の定義にかかわる平行検査法の他に、信頼性を測定したり推定したりする方法として、つぎの方法がある: (2)再検査法 (3)折半法 (4)内部的一致性による方法 (4-1) クーダー・リチャードソンの(第20)公式 (4-2) (クロンバックの)アルファ係数
再検査法とは? とすると、つぎの関係を導くことができる: 同一被験者に対して、同一検査を2時点で測り、 両時点 s, t での得点間の相関係数を とすると、つぎの関係を導くことができる:
再検査法による(同一被験者の)同一検査の 再検査法による相関係数 と信頼性の関係 再検査法による(同一被験者の)同一検査の 2時点での得点間の相関係数は、検査の 信頼性に等しい。
再検査法の特徴と問題点 同一被験者に対して、同一な検査(テスト)を、2時点で行う。 再検査法による信頼性係数は、安定度係数 (coefficient of stability) とも呼ばれる。 しかし、再検査法を用いると、被験者が前の検査結果を記憶していることが多く、そのために信頼性が大きくなる傾向があり、あまり使われない(Kuder & Richardson, 1937, p.151)。
折半法とは? 1つの検査を同質な2つの部分に分け、両得点間の相関係数ρ12 を計算すると、平行性の条件が成り立つとき、つぎの関係を導くことができる:
折半法の特徴と問題点 折半法では、平行検査法や再検査法による信頼性とは異なり、1つの検査を2つの部分に分けて、両得点間の相関係数から、うえの関係を使って検査の信頼性(係数)を求める。 折半法の計算式は、スピアマン・ブラウンの公式と呼ばれる。 折半法で検査の信頼性(係数)を計算できるためには、折半した2つの検査が平行性の条件を満たしていないといけない。