ベイズ・アプローチによる グラフィカル・テスト理論

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
1 項目反応理論によるテストの作成 東京工業大学 大学院社会理工学研究科 前川 眞一.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
Pattern Recognition and Machine Learning 1.5 決定理論
Bassモデルにおける 最尤法を用いたパラメータ推定
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
ベイズ的ロジスティックモデル に関する研究
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
京都大学 化学研究所 バイオインフォマティクスセンター
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
第Ⅱ部 協力ゲームの理論 第9章 シャープレイ値.
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 連立方程式モデル ー 計量経済学 ー.
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第9章 混合モデルとEM 修士2年 北川直樹.
教師なしデータ 学習データ  X1, X2, …, Xn   真の情報源 テストデータ  X  .
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
Introduction to Soft Computing (第11回目)
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
ボルツマンマシンの定義 ボルツマンマシン(Boltzmann machine)は、スピン・システムをヒントに作られたモデルである。
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
経営学研究科 M1年 学籍番号 speedster
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
Jan 2015 Speaker: Kazuhiro Inaba
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

ベイズ・アプローチによる グラフィカル・テスト理論 ベイズ・アプローチによる       グラフィカル・テスト理論 植野 真臣 日本教育工学会論文誌 / 日本教育工学雑誌 24(1), 35-52, 2000 発表者:佐藤 篤 日時:11月6日

論文の内容 ベイズアプローチによるグラフィカル・テスト理論の定式化 母数推定と構造推定法 予測分布最大化によるテスト情報量(EVTIN)の定式化 従来のテスト理論との理論的比較についての考察

グラフィカル・テスト理論 教材構造を確率ネットワークとして定式化し、統計的意思決定論の枠組みによりテスト構成を行おうとするもの

はじめに グラフィカル・テスト理論はいままで提案されてきたテスト理論の利点を統合的に有し、統一的な視点から、さまざまなテスト理論モデルに漸近収束、または変化していくモデルである。 当初、確率ネットワークと呼ばれるAI分野の比較的新しい技術の応用として定式化されたために、その統計モデルとしての定式化は正確に行われていない。

グラフィカル・テスト理論 の統計モデル(基本モデル) グラフィカル・テスト理論    の統計モデル(基本モデル) N個の項目の i 番目の項目に対して、その反応に対する確率変数 xi を導入すると、N項目に対する反応パターンの同時確率は p(x1,x2,‥・,xN)=Πp(xi | x1,x2,‥・,xi-1) =Πp(xi | Πi) と表される。

グラフィカル・テスト理論 の統計モデル(基本モデル) グラフィカル・テスト理論    の統計モデル(基本モデル) この確率モデルは、確率の定義から導かれる定理であり、なんらテストデータ特有のデータ発生メカニズムに対する仮定を置いていない。 例外の存在を許容するモデルが提供される。

グラフィカル・テスト理論 の統計モデル(ベイズ・モデル) グラフィカル・テスト理論  の統計モデル(ベイズ・モデル) ξijkをΠi=jのときの条件付き確率パラメータとし、{ξijk},i=1,‥・,N,j=0‥・,qi,k=0,1とすると、jはj番目の親ノードを、kは変数の取り得る値を示す。よってテストデータは p(x1,・‥,xN|ξ,S)=ΠΠΠξijk

グラフィカル・テスト理論 の統計モデル(ベイズ・モデル) グラフィカル・テスト理論  の統計モデル(ベイズ・モデル) 前ページの式が、n人のランダムに採集されたデータX(N*n)を得たとすると論文中(3)式のように表すことができる。

構造の推定 グラフィカル・テスト理論では、データから構造を推定することができる。 p(S|X)=p(S)p(X|S) / ∑g∈G p(S)p(X|S) で構造Sに対する事後分布を導き出す。

構造の推定 (11)(12)(13)(14)式による証明により、真のハイパーパラメータが1/2でなくても、真の構造を得る保証がある。すなわち、一致性がある。 NP-hard問題の回避には 親探しアルゴリズム アーク消去型アルゴリズム 遺伝的アルゴリズムによる全数探索 の三つが有力である。

テスト情報量 統計的意思決定論では、期待されるデータの価値EVSIを(17)式のように定式化する。 テスト情報量EVTINは、未知なる項目への被験者の反応を如何に少ない項目で予測するかを効用としたテスト構成を実現できる。

テストデータによる 未知項目の予測 EVTINを最大とするテストを実施した後、未知の項目への反応を各被験者ごとに予測することができる。 テストデータによる        未知項目の予測 EVTINを最大とするテストを実施した後、未知の項目への反応を各被験者ごとに予測することができる。 テスト情報量ENTIN最大化によるテスト構成は、この未知項目への予測を最大化するように最適化

適応型テスト グラフィカル・テスト理論を用いて適応型テストを開発することができる。 項目情報量EVTINが最大となるように項目を出題していき、それがある近傍ε以下になった時にテストを打ち切る。 どのノードを理解して、どのノードを理解していないかが推論できる。

テスト得点の予測 (22)式によってテスト得点の予測ができる。 少数の項目出題から、全体中どのくらい出来ているかを推測。

項目応答理論との関係 グラフィカル・テスト理論における同時確率は、項目数Nを大きくすると項目応答理論モデルの同時確率に近づく。すなわちモデルとしては同値になる。(25、26式により証明)‥・Theorem 1 一般に、項目応答理論のような潜在変数モデルでは、潜在変数に標準正規分布を仮定するが、n’ijkが小さくても、z-分布は正規分布によく近似される。

項目応答理論との関係 項目数Nを増やすとグラフィカル・テスト理論は項目応答理論に一致し、局所独立性も成り立つ。 精度高く推定されたグラフィカル・テスト理論におけるパラメータおよび構造を用い、項目応答理論における能力推定値θsや項目パラメータai,biを求めることができる。(27,28,29式)

フィッシャー情報量との関係 項目応答理論を用いる場合に、項目の持つ良さの尺度としてフィッシャー情報量が用いられ、ここでは(30)式で表される。 フィッシャー情報量の逆数は、一般に最尤推定値の漸近分散で示すが、同様にベイズ推定値にも同じことの証明ができる。(31,32)式

フィッシャー情報量との関係 グラフィカル・テスト理論における情報量EVTINは(33)式によって示され、カルバックライブラー情報量のこれから出そうとしているテスト項目についての期待値を示している。 N’に対してテスト項目N’が充分に大きくなるとき、グラフィカル・テスト理論における同時確率は、項目数Nを大きくすると項目応答理論モデルの同時確率に近づく。

フィッシャー情報量との関係 カルバックライブラーのパラメータ近傍の漸近性質により34,35式が求められ、前ページ同様、項目数を増やしていくと、グラフィカル・テスト理論の情報量EVTINは項目応答理論におけるフィッシャー情報量のN’^2/2倍に近づいていき、されに情報量の加法性が成り立っていく。すなわち大量の項目数を持つテストを構成する場合、グラフィカル・テスト理論におけるテスト構成と項目応答理論におけるテスト構成は同一となる。

項目関連構造分析との関係 IRS分析の項目間の順序性係数は(36)式で定義され、独立性の定義は(37)、(38)式を満たせばよい。ゆえにIRS分析における順序性の定義は独立性の定義と同義である。

項目関連構造分析との関係 IRS分析によって構成された教材構造について、グラフィカル・テスト理論において、親ノードが互いに独立という制約の下では、ハイパーパラメータ n’ijkを1/2lognとした時の構造Sの事後分布最大化によって得られた構造を得るのと等しい。 ハイパーパラメータを用いた場合、IRS分析で得られる構造とグラフィカル・テスト理論における構造は一致する。

おわりに 本論文(理論)でベイズ統計的アプローチを導入する利点は ①少数データのサンプリングによって、条件付確率パラメータが0や1などに推定されることを防ぐ。 ②周辺尤度や周辺事後分布が漸近展開などの近似なく正確にもとめることができる。 ③ハイパーパラメータをさまざまに変化させることによって、さまざまなテスト理論モデルに漸近収束っさせることができる。

今後の目標 大規模型教育データバンク(テストデータを中心にして)の開発とWeb上での共有 グラフィカル・テスト理論のユーザーフレンドリーなシステム化 大規模型データのための解析ツールの開発(教育用データマインド手法の開発) 新しい効用関数の開発とテスト構成の目的分析

ためになった部分 グラフィカル・テスト理論はこれまでのテスト理論の利点を総合的に有し、統一的な視点からさまざまなテスト理論に漸近収束、変化するモデルということで、これを自分のシステムに入れることができたらすごいかな‥・ 論文中にIRSやS-P、IRTなどの話が出てきたのでいろんな理論の再確認ができた。

ためになった部分 テストの得点予測などについてはおもしろいと感じた。 グラフィカル・テスト理論とIRS、IRTとの関係などが述べられている部分に興味を持てた。

参考文献 竹谷 誠 「新・テスト理論 教育情報の構造分析法」 、早稲田大学出版部