Presentation is loading. Please wait.

Presentation is loading. Please wait.

項目間の関連を分類するための指標の研究 ◇主な内容◇ ① 左図の?を示す ② これにより、次の○を埋める 順序性係数 ? ? 相関係数

Similar presentations


Presentation on theme: "項目間の関連を分類するための指標の研究 ◇主な内容◇ ① 左図の?を示す ② これにより、次の○を埋める 順序性係数 ? ? 相関係数"— Presentation transcript:

1 項目間の関連を分類するための指標の研究 ◇主な内容◇ ① 左図の?を示す ② これにより、次の○を埋める 順序性係数 ? ? 相関係数
① 左図の?を示す ② これにより、次の○を埋める データ型 順序性係数の定義 実データでの検証 1-0データ 竹谷1979 多数あり 確率 正答率 順序性係数 私の発表の主な内容は、「順序性係数と相関係数、回帰係数の関係を調べること」によって、「1-0データ上で定義されている順序性係数を、確率もしくは正答率上に拡張して、その適合性を実データで検証する」ものです。この表の?の部分と○の部分を埋めます。 相関係数 回帰係数 公式あり 元高校教員 浅尾 彰俊

2 先行研究の概要 ○ 正誤情報 ○ 2×2分割表(集計したもの) a+b c+d a+c b+d N(総人数) 項目k 小計 項目j a b
○ 正誤情報 異なる回答者 項目j 1 項目k 集計 a=5 b=3 c=4 d=2 集計 ○ 2×2分割表(集計したもの) 項目k 小計 項目j a b a+b c d c+d a+c b+d N(総人数) 1 はじめに、順序性係数の定義を振り返ってみますと、2つの項目jとkについて、上の表のような正誤情報があるとき、これを集計して下の表のような2×2分割表が得られたものとします。  両方とも正答であった人数をa、項目jのみ正答であった人数をb、項目kのみ正答であった人数をc、両方とも誤答であった人数をd、回答者総数をNとします。 1

3 先行研究の概要 順序性係数の定義(竹谷1979) a+b c+d a+c b+d N(総人数) 項目k 小計 項目j a b c d 1 1
1 このとき、順序性係数は画面のように定義され、この値がある「しきい値」以上になるとき、 「項目jが誤答となる者のほとんどは項目kも誤答となる」 「項目jができなければ項目kはできない」と解釈されます。  cの値が痩せてくることが目印になります。 ○ Cが他と比べて小さいとき、第2項は小さくなり、順序性係数は大きくなる。 ○ 順序性係数がある「しきい値(通常0.5)」以上のときに「順序性がある」とする。 ○ 順序性があるとき、「項目jができなければ、項目kはできない。」と解釈 

4 先行研究の確認 実データに対する適用例 1-0データ 筆者のデータ 例1 中学校1年生 数学の問題 データ件数 N=700
実データに対する適用例 1-0データ 筆者のデータ 例1 中学校1年生 数学の問題 データ件数 N=700 第1問 x+2=5 第2問 x-4=7 第3問 3x=6 第4問 2x+4=10 第5問 4x-8=16 第6問 7x=5x+6 第7問 7-3x=8+2x 第8問 5(x-3)=4(7-2x) 第9問 -4(x+3)=2(5-x) 第10問 7x-3(x+2)=11 要因 第1問 第2問 第3問 第4問 第5問 第6問 第7問 第8問 第9問 第10問 定数項移項 x移項 係数で割り算 かっこをはずす 解が分数 1-0データについての順序性係数を用いて、私の集計した実データで検証したのが例1です。  このデータは、中学校1年生 数学の問題で1次方程式の解き方を扱ったもので、問題および各問題に含まれている要因、回答者総数は画面の通りです。 (これは、Web教材として公開したものの回答を集計したもので、データは各項目について1か0かの形になっています。)

5 先行研究の確認 の順序関係一覧表 例1 p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 ・・・ → ←→
この回答から順序性をその定義にしたがって求めるとこの表のようになります。  右向き矢印は、左の欄の項目から上の欄の項目への順序性を表します。  第8問と第10問には双方向の順序性が認められます。・・・で示したものは、後で述べる「擬似相関」もしくは「遠い順序関係」です。

6 先行研究の確認 のIRSグラフ 例1 「jできない→kできない」 を表す すでに間接的につながっているときは直接の矢印は書かない
(数学記号の 十分条件→必要条件 とは逆) すでに間接的につながっているときは直接の矢印は書かない 得られた順序関係から、項目関連グラフを作るとこのようになり、当初予定した要因表と照らし合わせてほぼ納得のいくものになります。  矢印は、通常、正答率の高いものから低いものに向かい、間接的につながっているときは直接結ぶ矢印は省略します。 (第9問は、よく考えなければできないような選択問題で、先頭の選択肢を正答にしてしまったため、まぐれ当たりが増えて関係性が切れています。)

7 本研究の概要(1) 項目j 1-0データ データの形 項目k 集計 拡張 確率・正答率データ データの形 項目j 項目k 異なる回答者 1
項目k 集計 a=5 b=3 c=4 d=2 拡張  確率・正答率データ 異なる回答者 データの形 項目j 0.9 0.8 0.7 0.6 0.1 0.2 0.3 0.0 項目k ここからが、本研究の中身です。  順序性係数は1-0データ上で定義されているので、データが確率であるときには、そのまま使うことはできません。これをデータが確率もしくは正答率である場合にも適用する方法を考えます。  具体的には、上の表のようなデータでa=5, b=3, c=4, d=2と数えるところを、下の表においてどのように計算すればよいかということを考えます。

8 a=5 c=4 b=3 d=2 本研究の概要(1) 回帰式が となるとき 内分点 内分点
もとの1-0データ上で定義されている順序性係数を、振り返ってみますと  項目jの正答率をp、項目kの正答率をqとおいて、回帰分析を行ったとき、 定数項α=c/(c+d) は、「項目jが誤答であるときに、項目kが正答となる条件付き確率」を表します。 Α+β=a/(a+b)は、「項目jが正答であるときに項目kが正答となる条件付き確率」を表します。 したがって、回帰係数βは「項目jが正答であるか誤答であるかによる、項目kの正答率の差」を表します。 b=3 d=2

9 本研究の概要(1) 順序性係数の定義 回帰係数→順序性係数 順序性係数と回帰係数の関係 1-0データ ○ 1-0データ ○ 1-0データ ○
以上のように、2×2分割表の集計を回帰係数で表しておきますと、1-0データ上でのみ定義される順序性係数を、回帰係数で読み替えことができ、もとのデータが確率もしくは正答率である場合にも適用できるのではないか、というのが本研究の提案です。  この式は、元の順序性係数の定義を書き直しただけのもので、何ら新規性はありませんが、式の解釈を変えることができます。 1-0データ ○ 確率データ ○ 回帰係数→順序性係数

10 因子分析の用語と紛らわしくならないように「要因」と表示
本研究の概要(1) 因子分析の用語と紛らわしくならないように「要因」と表示 共通要因 の割合 K独自要因 の割合 すなわち、項目kの正答率を「定数項αの部分」と「比例部分βp」に分けて考えますと、 α/q が「項目k独自要因の割合」をβp/q が「共通要因の割合」を示すと解釈できます。 (qのうちでpに依存する部分=qにもpにも依存する部分=共通要因) (pに依存する部分のうち共通要因を取り除いたもの=pだけに依存する部分)  このように考えると、「項目jから項目kへの順序性」が表す内容は、「項目kを解くために必要な能力のうち、項目jと共通な要因の割合」を示していると解釈することができます。 回帰直線のうち、「独自の要因」と「共通の要因」を図示すると右の図のようになると考えられます。項目jからkへの回帰を裏返しても、項目kからjへの回帰になりませんので、右図の「項目j独自の要因」はそのままには使っていません。(pに対する比は項目jにおいて再計算します)

11 本研究の概要(1) 2×2分割表における相関係数(連関係数) 順序性係数 順序性係数と相関係数の関係
いずれか1つのセルの「確率」と「独立なときの理論値」との差 (を標準化したもの) (   )内は のいずれでも同じ 順序性係数と相関係数の関係 2×2分割表における相関係数(連関係数) 1-0データ ○ 順序性係数 元のデータが「確率」もしくは「正答率」である場合の順序性係数は、以上のように回帰係数との関係式だけで求めることができますが、データ件数が少ない場合などに対応するために「相関係数の有意性」「回帰係数の有意性」を吟味する必要がありますので、ここでは相関係数の有意性の判断を用いて順序性係数の有意性を判断することにして、これらの関係式も求めておきます。  相関係数を表す式は、bとcを入れ替えても値が変化しませんので、2つの項目について対称な指標になっていることを確かめることができます。 1-0データ ○

12 本研究の概要(1) 相関係数→順序性係数 (別ルートも可) 1-0データ ○ 確率データ ○
このように相関係数からでも順序性係数が求められます。 (別ルートも可)

13 「カイ2乗」「条件付き確率の比較」などによる独立性の検定 総数Nの効果 あり
参考:独立性の検定と比較したとき (筆者の考え) Nが数百になれば ほとんどの項目は 「独立でない」と判定される 検定は 帰無仮説にズームインする 「カイ2乗」「条件付き確率の比較」などによる独立性の検定 総数Nの効果 あり 独立と仮定して検定する 「従属の程度」は分からない 単なる比率を表し 総数Nの効果なし 仮説はなく ズームインしない 順序性係数 参考として、「順序性の定義は独立性の定義と裏表のものではないのか」という考え方もありますが、「独立性の検定」を順序性の判定に用いるのは無理だと考えられます。 といいますのは、「独立性の検定」では、独立という帰無仮説を置いて、データ件数が多くなるとその仮定のまわりにズームインして、独立でないものをはねるという使われ方なので、従属の程度は数値化されないのに対して、「順序性係数」には総数の効果はなく「相関係数」や「回帰係数」と同様に程度を表す数値だと考えられます。 特に、カイ2乗は2つの項目に対称な値になり、そもそも順序関係を調べるのは無理なようです。 回帰係数や相関係数 と同様に「程度」を表す数字 総数Nを増やしても 識別力が変化しない 「ものさし」

14 本研究の概要(2) □ 分類したい項目間の関係 ア 項目j→項目kの順序関係が認められるもの イ 項目k→項目jの順序関係が認められるもの
□ 分類したい項目間の関係 ア 項目j→項目kの順序関係が認められるもの イ 項目k→項目jの順序関係が認められるもの ウ 項目j,k間に双方向順序関係が認められるもの エ 項目j,k間の順序関係はないが,各々第3の項目lと順序関係があり,相関関係が認められるもの(いわゆる擬似相関) または,遠い順序関係にあるもの オ 項目j,k間には順序関係も相関関係もないもの(項目j,kは独立) j k j k j k 項目関連グラフを作るためには、順序性係数の値に応じて各項目間の関係を分類しておく必要があります。  先行研究では図のアイウオが登場しますが、エも含めるとすべての関係が分類できるのではないかと考えました。 k l j k j j k

15 エ イ j←k ア j→k ウ j←→k 本研究の概要(2) □ 順序性係数を用いた分類 (エを含めるとすべて分類できる:筆者の考え) オ
□ 順序性係数を用いた分類 (エを含めるとすべて分類できる:筆者の考え) (独立) 無印 (擬似相関または遠い順序関係)・・・ j←k j→k j←→k 第2の「しきい値」も考えるとすべての関係が分類できると考えられます。ただし、この分類「エ」はできたグラフから確認する程度で、あまり積極的に使うことはできませんでした。  といいますのは、理屈の上では「エ」が一般の場合で、アイウオがそのうち特別な場合を取り出したものになりますが、 (1) 「エ」の分類では、いわゆる擬似相関なのか遠い順序関係なのかを数値だけでは区別できません (2) 遠い順序関係でないときに擬似相関とするためには、観測項目でない潜在要因が必要になることがあり、本研究で想定している範囲を超えてしまう という事情があるためです。 ※本研究では const1=0.3 , const2=0.5 で計算

16 本研究の概要(3) 実データでの検証 確率・正答率データ 例2 Web教材の回答集計
実データでの検証 確率・正答率データ p50 p51 p53 p54 p55 p57 p60 p64 p67 p68 0.47 0.49 ・・ 0.50 1.07 0.27 1.43 0.20 0.41 0.19 0.43 0.84 0.26 0.68 0.23 0.61 0.45 0.65 0.88 0.18 0.16 0.57 0.24 0.66 0.56 0.59 0.60 0.14 0.25 0.31 0.71 0.35 0.48 0.37 例2 Web教材の回答集計 から の期間に回答のあった22,282件の答案のうち同一人物の重複回答を除く9,410人の回答から p50 p51 p53 p54 p55 p57 p60 p64 p67 p68 ・・・ →  →   ←→ 個別の答案の件数 例えば64→68はN=89人のデータ 以上のように、検討した「確率」もしくは「正答率」データ上での順序性係数を、実データに当てはめて、適合性を調べたのが例2です。  これは、中学校1年生の比例・図形の答案を集計して、出題した頁間の関係を調べたものです。  上の表の・・は無相関ではねたもの、下の表の・・・は分類表のエで示した擬似相関ないしは遠い順序関係です 通常のテストと違い、Web教材では何百頁もある問題を全部解く人はおらず、ほとんどの人は幾つかの頁だけを解いています。特に、現役の中学生では習っていない単元はできませんので、6月段階で1年生の問題が解けるのは2年生以上ということになります。2年生はあまり参加してきませんので、実際には3年生または卒業生の理解構造を調べていることになります。

17 本研究の概要(3) 実データでの検証 確率・正答率データ IRSグラフ 68 67 64 57 54 55 60 53 50 51 例2
実データでの検証 確率・正答率データ 例2 による 立体の表面積 IRSグラフ 68 扇形の面積 立体の体積 67 64 反比例 反比例のグラフ 比例 比例 57 54 55 60 53 グラフにしたものです。 比例反比例グラフ 50 xy座標 51 xy座標 は項目番号

18 本研究の概要(3) 実データでの検証確率・正答率データ 38 28 18 IRSグラフ 34 31 24 21 41 22 速さと時間
例2と同じWeb教材 の回答集計 による 方程式(分数係数) 個別の答案の件数 例えば34→28はN=68人のデータ 38 式の値1 文字の使用 28 18 例3 前出の は、この1粒 例1 方程式 IRSグラフ 34 31 関係を表す式 同様にして、これは、中学校1年生の文字式・方程式の答案を集計して、出題した頁間の関係を調べたものです。 文字を使った式 速さと時間 1次方程式 24 21 41 文字を 使った式 は項目番号 22

19 □ まとめ □ 順序性係数を回帰係数で表し,データが確率である場合に拡張する可能性を探った. (確率→) (1,0データ→)
□ まとめ □  順序性係数を回帰係数で表し,データが確率である場合に拡張する可能性を探った. (確率→) (1,0データ→)  相関係数との関係から順序性係数の有意性を判断した. (1,0データ→) (確率→)  データが確率である場合の順序性係数(試案)を実データに適用して,順序関係(因果関係)がどのくらい解明できるかを調べ,よい結果が得られた. 方程式(分数係数) 立体の表面積 38 扇形の面積 68 まとめです。  順序性係数を回帰係数で表し,データが確率である場合に拡張する可能性を探りました. 相関係数との関係から順序性係数の有意性を判断しました. データが確率である場合の順序性係数(試案)を実データに適用して,順序関係(因果関係)がどのくらい解明できるかを調べ,よい結果が得られました. 文字の使用 67 立体の体積 18 式の値1 28 64 反比例 のグラフ 例3 例2 反比例 54 34 方程式 57 55 60 比例 比例 31 関係を表す式 比例反比例 グラフ 文字を使った式 53 1次方程式 xy座標 速さと時間 50 21 41 24 xy座標 51 文字を使った式 22

20 □ ポイント □ ・・・確率データに順序性係数を適用する方法 (1) 変数を標準化せず、0≦p,q≦1の確率として使う(αを使うため)
□ ポイント □ ・・・確率データに順序性係数を適用する方法 (1) 変数を標準化せず、0≦p,q≦1の確率として使う(αを使うため) できないものの例 身長と体重の関係 ←単位を変えても値域が0~1にならない できるものの例 アンケート項目間の関係 ←確率になるものは、構造が求められる       (ただし、本研究では潜在変数は使わない) (2) 順序性係数を回帰係数で表す (3) α(βp)とqの比によって順序性を解釈する が大きいと、pからqへの影響は小さい 数式や実データなどが多数出てきましたので、ポイントとなる部分だけを整理しておきますと 変数を標準化せずに、αを使うのが第1点です 順序性係数を回帰係数で表すのが第2点です 回帰係数とqの比によって順序性を解釈するというのが第3点です。 (逆に、小さいと    ・・・  大きい) 他の 分析方法 回帰係数βまたは相関係数 rによって影響の大小を判断(因果の「向き」は係数だけでは判断できない) 本研究 の大小で「向き」を判断


Download ppt "項目間の関連を分類するための指標の研究 ◇主な内容◇ ① 左図の?を示す ② これにより、次の○を埋める 順序性係数 ? ? 相関係数"

Similar presentations


Ads by Google