周育佳 東京外国語大学地域文化研究科博士後期課程 テスト統計の理論的概略 周育佳 東京外国語大学地域文化研究科博士後期課程
概 要 古典的テスト理論 項目応答理論
古典的テスト理論の基盤 テストの得点の求め方 素点(raw score) =正答数に基づく得点である。
テストが難しいとは? 項目困難度: ⇒正答率=正答者数/受験者総数
能力が低いとは? 本当に能力がないのか? それとも、テストが難しいからか? 偏差値の使用
項目弁別力(1) 項目弁別力 ⇒ある項目が能力の高い受験者とそうでない受験者を弁別することができる度合いである。 計算方法 ①=上位27%の受験者の正解率ー下位27%の受験者の正解率
項目弁別力(2) 点双列相関係数 =item-total Pearson r すべてのデータを用いて、算出する方法。 テスト総得点が高いものは、それぞれの項目でも正解を出しているかどうか
古典テスト理論の限界(1) 1.テスト依存 -受験者の能力は、テストの困難度を考えずに、定義できない。(テスト点数とは、正解したテストの項目の数) 2.項目の困難度は、受験者に依存 -項目の難易度は、そのテストを受ける受験者によって、決定される。(項目困難度=正解率) ⇒受験者の能力と項目の難易度の測定は、切り離せない。
古典的テスト理論信頼性 テスト得点の安定性である。 観測された得点=真の得点+誤差得点 信頼性係数=真の得点の分散/観測された得点の分散 テスト得点の安定性である。 観測された得点=真の得点+誤差得点 信頼性係数=真の得点の分散/観測された得点の分散 (真の得点の分散が、観測スコアに占める割合。)
項目応答理論 古典的テスト理論の欠点を克服するために、開発されました。 応用:大規模テストが多い。 TOEFL, GREなど。 特徴:受験者能力と項目困難度が共通尺度で表される。 (-3~3) (図)
項目応答理論特徴(1) Test-free person measurement どんな異なったテストを用いても共通の尺度上で能力測定が可能。
項目応答理論特徴(2) Sample-free item calibration どんな受験者集団に実施しても、共通の項目特性(項目困難度、項目弁別力など)に関する値を求めることが可能。ちなみに、これらは、受験者集団とは、独立して求めることができる。