Presentation is loading. Please wait.

Presentation is loading. Please wait.

ベイズ・アプローチによる グラフィカル・テスト理論

Similar presentations


Presentation on theme: "ベイズ・アプローチによる グラフィカル・テスト理論"— Presentation transcript:

1 ベイズ・アプローチによる グラフィカル・テスト理論
ベイズ・アプローチによる       グラフィカル・テスト理論 植野 真臣 日本教育工学会論文誌 / 日本教育工学雑誌 24(1), 35-52, 2000 発表者:佐藤 篤 日時:11月6日

2 論文の内容 ベイズアプローチによるグラフィカル・テスト理論の定式化 母数推定と構造推定法
予測分布最大化によるテスト情報量(EVTIN)の定式化 従来のテスト理論との理論的比較についての考察

3 グラフィカル・テスト理論 教材構造を確率ネットワークとして定式化し、統計的意思決定論の枠組みによりテスト構成を行おうとするもの

4 はじめに グラフィカル・テスト理論はいままで提案されてきたテスト理論の利点を統合的に有し、統一的な視点から、さまざまなテスト理論モデルに漸近収束、または変化していくモデルである。 当初、確率ネットワークと呼ばれるAI分野の比較的新しい技術の応用として定式化されたために、その統計モデルとしての定式化は正確に行われていない。

5 グラフィカル・テスト理論 の統計モデル(基本モデル)
グラフィカル・テスト理論    の統計モデル(基本モデル) N個の項目の i 番目の項目に対して、その反応に対する確率変数 xi を導入すると、N項目に対する反応パターンの同時確率は p(x1,x2,‥・,xN)=Πp(xi | x1,x2,‥・,xi-1) =Πp(xi | Πi) と表される。

6 グラフィカル・テスト理論 の統計モデル(基本モデル)
グラフィカル・テスト理論    の統計モデル(基本モデル) この確率モデルは、確率の定義から導かれる定理であり、なんらテストデータ特有のデータ発生メカニズムに対する仮定を置いていない。 例外の存在を許容するモデルが提供される。

7 グラフィカル・テスト理論 の統計モデル(ベイズ・モデル)
グラフィカル・テスト理論  の統計モデル(ベイズ・モデル) ξijkをΠi=jのときの条件付き確率パラメータとし、{ξijk},i=1,‥・,N,j=0‥・,qi,k=0,1とすると、jはj番目の親ノードを、kは変数の取り得る値を示す。よってテストデータは p(x1,・‥,xN|ξ,S)=ΠΠΠξijk

8 グラフィカル・テスト理論 の統計モデル(ベイズ・モデル)
グラフィカル・テスト理論  の統計モデル(ベイズ・モデル) 前ページの式が、n人のランダムに採集されたデータX(N*n)を得たとすると論文中(3)式のように表すことができる。

9 構造の推定 グラフィカル・テスト理論では、データから構造を推定することができる。
p(S|X)=p(S)p(X|S) / ∑g∈G p(S)p(X|S) で構造Sに対する事後分布を導き出す。

10 構造の推定 (11)(12)(13)(14)式による証明により、真のハイパーパラメータが1/2でなくても、真の構造を得る保証がある。すなわち、一致性がある。 NP-hard問題の回避には 親探しアルゴリズム アーク消去型アルゴリズム 遺伝的アルゴリズムによる全数探索 の三つが有力である。

11 テスト情報量 統計的意思決定論では、期待されるデータの価値EVSIを(17)式のように定式化する。
テスト情報量EVTINは、未知なる項目への被験者の反応を如何に少ない項目で予測するかを効用としたテスト構成を実現できる。

12 テストデータによる 未知項目の予測 EVTINを最大とするテストを実施した後、未知の項目への反応を各被験者ごとに予測することができる。
テストデータによる        未知項目の予測 EVTINを最大とするテストを実施した後、未知の項目への反応を各被験者ごとに予測することができる。 テスト情報量ENTIN最大化によるテスト構成は、この未知項目への予測を最大化するように最適化

13 適応型テスト グラフィカル・テスト理論を用いて適応型テストを開発することができる。
項目情報量EVTINが最大となるように項目を出題していき、それがある近傍ε以下になった時にテストを打ち切る。 どのノードを理解して、どのノードを理解していないかが推論できる。

14 テスト得点の予測 (22)式によってテスト得点の予測ができる。 少数の項目出題から、全体中どのくらい出来ているかを推測。

15 項目応答理論との関係 グラフィカル・テスト理論における同時確率は、項目数Nを大きくすると項目応答理論モデルの同時確率に近づく。すなわちモデルとしては同値になる。(25、26式により証明)‥・Theorem 1 一般に、項目応答理論のような潜在変数モデルでは、潜在変数に標準正規分布を仮定するが、n’ijkが小さくても、z-分布は正規分布によく近似される。

16 項目応答理論との関係 項目数Nを増やすとグラフィカル・テスト理論は項目応答理論に一致し、局所独立性も成り立つ。
精度高く推定されたグラフィカル・テスト理論におけるパラメータおよび構造を用い、項目応答理論における能力推定値θsや項目パラメータai,biを求めることができる。(27,28,29式)

17 フィッシャー情報量との関係 項目応答理論を用いる場合に、項目の持つ良さの尺度としてフィッシャー情報量が用いられ、ここでは(30)式で表される。 フィッシャー情報量の逆数は、一般に最尤推定値の漸近分散で示すが、同様にベイズ推定値にも同じことの証明ができる。(31,32)式

18 フィッシャー情報量との関係 グラフィカル・テスト理論における情報量EVTINは(33)式によって示され、カルバックライブラー情報量のこれから出そうとしているテスト項目についての期待値を示している。 N’に対してテスト項目N’が充分に大きくなるとき、グラフィカル・テスト理論における同時確率は、項目数Nを大きくすると項目応答理論モデルの同時確率に近づく。

19 フィッシャー情報量との関係 カルバックライブラーのパラメータ近傍の漸近性質により34,35式が求められ、前ページ同様、項目数を増やしていくと、グラフィカル・テスト理論の情報量EVTINは項目応答理論におけるフィッシャー情報量のN’^2/2倍に近づいていき、されに情報量の加法性が成り立っていく。すなわち大量の項目数を持つテストを構成する場合、グラフィカル・テスト理論におけるテスト構成と項目応答理論におけるテスト構成は同一となる。

20 項目関連構造分析との関係 IRS分析の項目間の順序性係数は(36)式で定義され、独立性の定義は(37)、(38)式を満たせばよい。ゆえにIRS分析における順序性の定義は独立性の定義と同義である。

21 項目関連構造分析との関係 IRS分析によって構成された教材構造について、グラフィカル・テスト理論において、親ノードが互いに独立という制約の下では、ハイパーパラメータ n’ijkを1/2lognとした時の構造Sの事後分布最大化によって得られた構造を得るのと等しい。 ハイパーパラメータを用いた場合、IRS分析で得られる構造とグラフィカル・テスト理論における構造は一致する。

22 おわりに 本論文(理論)でベイズ統計的アプローチを導入する利点は
①少数データのサンプリングによって、条件付確率パラメータが0や1などに推定されることを防ぐ。 ②周辺尤度や周辺事後分布が漸近展開などの近似なく正確にもとめることができる。 ③ハイパーパラメータをさまざまに変化させることによって、さまざまなテスト理論モデルに漸近収束っさせることができる。

23 今後の目標 大規模型教育データバンク(テストデータを中心にして)の開発とWeb上での共有
グラフィカル・テスト理論のユーザーフレンドリーなシステム化 大規模型データのための解析ツールの開発(教育用データマインド手法の開発) 新しい効用関数の開発とテスト構成の目的分析

24 ためになった部分 グラフィカル・テスト理論はこれまでのテスト理論の利点を総合的に有し、統一的な視点からさまざまなテスト理論に漸近収束、変化するモデルということで、これを自分のシステムに入れることができたらすごいかな‥・ 論文中にIRSやS-P、IRTなどの話が出てきたのでいろんな理論の再確認ができた。

25 ためになった部分 テストの得点予測などについてはおもしろいと感じた。
グラフィカル・テスト理論とIRS、IRTとの関係などが述べられている部分に興味を持てた。

26 参考文献 竹谷 誠 「新・テスト理論 教育情報の構造分析法」 、早稲田大学出版部


Download ppt "ベイズ・アプローチによる グラフィカル・テスト理論"

Similar presentations


Ads by Google