項目間の関連を分類するための指標の研究 ◇主な内容◇ ① 左図の?を示す ② これにより、次の○を埋める 順序性係数 ? ? 相関係数

Slides:



Advertisements
Similar presentations
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Advertisements

平成 27 年 10 月 21 日. 【応用課題 2-1 】 次のビット列は、ある 10 進数を 8 ビット固定小数点表示で表した時の ものです。ただし、小数点の位置は 3 ビット目と 4 ビット目の間としてお り、負数は2の補数で表しています。このとき、元の 10 進数を求めてく ださい。
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
熱流体力学 第4章 番外編 熱力学的系 状態方程式 熱力学で扱う偏微分公式 熱力学の第一法則(工学系と物理系)
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
初歩的情報リテラ シーと アンケート集計のた めの Excel ・ SPSS 講 座 2002 年 5 月 14 日 政策科学部助手 山田 一隆.
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
情報処理 第12回.
・力のモーメント ・角運動量 ・力のモーメントと角運動量の関係
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
一次関数と方程式 本時の流れ ねらい「二元一次方程式をグラフに表すことができる。」 ↓ 課題の提示 yについて解き、グラフをかく
実証分析の手順 経済データ解析 2011年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
星の明るさと等級 PAOFITS WG 開発教材 <解説教材> 製作: PaofitsWG <使い方> ①「実習の方法」についての説明に使う
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
確率・統計Ⅱ 第7回.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
システム開発実験No.7        解 説       “論理式の簡略化方法”.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
統計リテラシー育成のための数学の指導方法に関する実践的研究
需要の価格弾力性 価格の変化率と需要の変化率の比.
(ラプラス変換の復習) 教科書には相当する章はない
電気回路Ⅱ 演習 特別編(数学) 三角関数 オイラーの公式 微分積分 微分方程式 付録 三角関数関連の公式
第5回 統計処理(2) 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時 経済学部・法学部
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
相関分析.
第6章 連立方程式モデル ー 計量経済学 ー.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
中学数学1年 1章 正の数・負の数 §3 乗法と除法 (9時間).
正規分布確率密度関数.
6. ラプラス変換.
ルンゲクッタ法 となる微分方程式の解を数値的に解く方法.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
ねらい「二次方程式の解き方を理解する。」
二次方程式の解き方 ねらい「二次方程式を、平方根を利用して解くことができる。」 本時の流れ ↓ 前時の復習でax2=bの解き方を確認する。
母分散の信頼区間 F分布 母分散の比の信頼区間
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
第1学年 目標 (1) 具体物を用いた活動などを通して,数についての感覚を豊かにする。数の意
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
フーリエ級数.
回帰分析(Regression Analysis)
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
本時の目標 二元一次方程式とその解の意味を理解する。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
プログラミング論 相関
回帰分析入門 経済データ解析 2011年度.
ねらい いろいろな形の方程式を解くことを通して、方程式を解く手順を理解する。
3 一次関数 1章 一次関数とグラフ §4 方程式とグラフ         (3時間).
アルゴリズム ~すべてのプログラムの基礎~.
Presentation transcript:

項目間の関連を分類するための指標の研究 ◇主な内容◇ ① 左図の?を示す ② これにより、次の○を埋める 順序性係数 ? ? 相関係数 ① 左図の?を示す ② これにより、次の○を埋める データ型 順序性係数の定義 実データでの検証 1-0データ 竹谷1979 多数あり 確率 正答率 ○ 順序性係数 ? ? 私の発表の主な内容は、「順序性係数と相関係数、回帰係数の関係を調べること」によって、「1-0データ上で定義されている順序性係数を、確率もしくは正答率上に拡張して、その適合性を実データで検証する」ものです。この表の?の部分と○の部分を埋めます。 相関係数 回帰係数 公式あり 元高校教員 浅尾 彰俊

先行研究の概要 ○ 正誤情報 ○ 2×2分割表(集計したもの) a+b c+d a+c b+d N(総人数) 項目k 小計 項目j a b ○ 正誤情報 異なる回答者 項目j 1 項目k 集計 a=5 b=3 c=4 d=2 集計 ○ 2×2分割表(集計したもの) 項目k 小計 項目j a b a+b c d c+d a+c b+d N(総人数) 1 はじめに、順序性係数の定義を振り返ってみますと、2つの項目jとkについて、上の表のような正誤情報があるとき、これを集計して下の表のような2×2分割表が得られたものとします。  両方とも正答であった人数をa、項目jのみ正答であった人数をb、項目kのみ正答であった人数をc、両方とも誤答であった人数をd、回答者総数をNとします。 1

先行研究の概要 順序性係数の定義(竹谷1979) a+b c+d a+c b+d N(総人数) 項目k 小計 項目j a b c d 1 1 1 このとき、順序性係数は画面のように定義され、この値がある「しきい値」以上になるとき、 「項目jが誤答となる者のほとんどは項目kも誤答となる」 「項目jができなければ項目kはできない」と解釈されます。  cの値が痩せてくることが目印になります。 ○ Cが他と比べて小さいとき、第2項は小さくなり、順序性係数は大きくなる。 ○ 順序性係数がある「しきい値(通常0.5)」以上のときに「順序性がある」とする。 ○ 順序性があるとき、「項目jができなければ、項目kはできない。」と解釈 

先行研究の確認 実データに対する適用例 1-0データ 筆者のデータ 例1 中学校1年生 数学の問題 データ件数 N=700 実データに対する適用例 1-0データ 筆者のデータ 例1 中学校1年生 数学の問題 データ件数 N=700 第1問 x+2=5 第2問 x-4=7 第3問 3x=6 第4問 2x+4=10 第5問 4x-8=16 第6問 7x=5x+6 第7問 7-3x=8+2x 第8問 5(x-3)=4(7-2x) 第9問 -4(x+3)=2(5-x) 第10問 7x-3(x+2)=11 要因 第1問 第2問 第3問 第4問 第5問 第6問 第7問 第8問 第9問 第10問 定数項移項 ○ x移項 係数で割り算 かっこをはずす 解が分数 1-0データについての順序性係数を用いて、私の集計した実データで検証したのが例1です。  このデータは、中学校1年生 数学の問題で1次方程式の解き方を扱ったもので、問題および各問題に含まれている要因、回答者総数は画面の通りです。 (これは、Web教材として公開したものの回答を集計したもので、データは各項目について1か0かの形になっています。)

先行研究の確認 の順序関係一覧表 例1 p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 ・・・ → ←→ この回答から順序性をその定義にしたがって求めるとこの表のようになります。  右向き矢印は、左の欄の項目から上の欄の項目への順序性を表します。  第8問と第10問には双方向の順序性が認められます。・・・で示したものは、後で述べる「擬似相関」もしくは「遠い順序関係」です。

先行研究の確認 のIRSグラフ 例1 「jできない→kできない」 を表す すでに間接的につながっているときは直接の矢印は書かない (数学記号の 十分条件→必要条件 とは逆) すでに間接的につながっているときは直接の矢印は書かない 得られた順序関係から、項目関連グラフを作るとこのようになり、当初予定した要因表と照らし合わせてほぼ納得のいくものになります。  矢印は、通常、正答率の高いものから低いものに向かい、間接的につながっているときは直接結ぶ矢印は省略します。 (第9問は、よく考えなければできないような選択問題で、先頭の選択肢を正答にしてしまったため、まぐれ当たりが増えて関係性が切れています。)

本研究の概要(1) 項目j 1-0データ データの形 項目k 集計 拡張 確率・正答率データ データの形 項目j 項目k 異なる回答者 1 項目k 集計 a=5 b=3 c=4 d=2 拡張  確率・正答率データ 異なる回答者 データの形 項目j 0.9 0.8 0.7 0.6 0.1 0.2 0.3 0.0 項目k ここからが、本研究の中身です。  順序性係数は1-0データ上で定義されているので、データが確率であるときには、そのまま使うことはできません。これをデータが確率もしくは正答率である場合にも適用する方法を考えます。  具体的には、上の表のようなデータでa=5, b=3, c=4, d=2と数えるところを、下の表においてどのように計算すればよいかということを考えます。

a=5 c=4 b=3 d=2 本研究の概要(1) 回帰式が となるとき 内分点 内分点 もとの1-0データ上で定義されている順序性係数を、振り返ってみますと  項目jの正答率をp、項目kの正答率をqとおいて、回帰分析を行ったとき、 定数項α=c/(c+d) は、「項目jが誤答であるときに、項目kが正答となる条件付き確率」を表します。 Α+β=a/(a+b)は、「項目jが正答であるときに項目kが正答となる条件付き確率」を表します。 したがって、回帰係数βは「項目jが正答であるか誤答であるかによる、項目kの正答率の差」を表します。 b=3 d=2

本研究の概要(1) 順序性係数の定義 回帰係数→順序性係数 順序性係数と回帰係数の関係 1-0データ ○ 1-0データ ○ 1-0データ ○ 以上のように、2×2分割表の集計を回帰係数で表しておきますと、1-0データ上でのみ定義される順序性係数を、回帰係数で読み替えことができ、もとのデータが確率もしくは正答率である場合にも適用できるのではないか、というのが本研究の提案です。  この式は、元の順序性係数の定義を書き直しただけのもので、何ら新規性はありませんが、式の解釈を変えることができます。 1-0データ ○ 確率データ ○ 回帰係数→順序性係数

因子分析の用語と紛らわしくならないように「要因」と表示 本研究の概要(1) 因子分析の用語と紛らわしくならないように「要因」と表示 共通要因 の割合 K独自要因 の割合 すなわち、項目kの正答率を「定数項αの部分」と「比例部分βp」に分けて考えますと、 α/q が「項目k独自要因の割合」をβp/q が「共通要因の割合」を示すと解釈できます。 (qのうちでpに依存する部分=qにもpにも依存する部分=共通要因) (pに依存する部分のうち共通要因を取り除いたもの=pだけに依存する部分)  このように考えると、「項目jから項目kへの順序性」が表す内容は、「項目kを解くために必要な能力のうち、項目jと共通な要因の割合」を示していると解釈することができます。 回帰直線のうち、「独自の要因」と「共通の要因」を図示すると右の図のようになると考えられます。項目jからkへの回帰を裏返しても、項目kからjへの回帰になりませんので、右図の「項目j独自の要因」はそのままには使っていません。(pに対する比は項目jにおいて再計算します)

本研究の概要(1) 2×2分割表における相関係数(連関係数) 順序性係数 順序性係数と相関係数の関係 いずれか1つのセルの「確率」と「独立なときの理論値」との差 (を標準化したもの) (   )内は のいずれでも同じ 順序性係数と相関係数の関係 2×2分割表における相関係数(連関係数) 1-0データ ○ 順序性係数 元のデータが「確率」もしくは「正答率」である場合の順序性係数は、以上のように回帰係数との関係式だけで求めることができますが、データ件数が少ない場合などに対応するために「相関係数の有意性」「回帰係数の有意性」を吟味する必要がありますので、ここでは相関係数の有意性の判断を用いて順序性係数の有意性を判断することにして、これらの関係式も求めておきます。  相関係数を表す式は、bとcを入れ替えても値が変化しませんので、2つの項目について対称な指標になっていることを確かめることができます。 1-0データ ○

本研究の概要(1) 相関係数→順序性係数 (別ルートも可) 1-0データ ○ 確率データ ○ このように相関係数からでも順序性係数が求められます。 (別ルートも可)

「カイ2乗」「条件付き確率の比較」などによる独立性の検定 総数Nの効果 あり 参考:独立性の検定と比較したとき (筆者の考え) Nが数百になれば ほとんどの項目は 「独立でない」と判定される 検定は 帰無仮説にズームインする 「カイ2乗」「条件付き確率の比較」などによる独立性の検定 総数Nの効果 あり 独立と仮定して検定する 「従属の程度」は分からない 単なる比率を表し 総数Nの効果なし 仮説はなく ズームインしない 順序性係数 参考として、「順序性の定義は独立性の定義と裏表のものではないのか」という考え方もありますが、「独立性の検定」を順序性の判定に用いるのは無理だと考えられます。 といいますのは、「独立性の検定」では、独立という帰無仮説を置いて、データ件数が多くなるとその仮定のまわりにズームインして、独立でないものをはねるという使われ方なので、従属の程度は数値化されないのに対して、「順序性係数」には総数の効果はなく「相関係数」や「回帰係数」と同様に程度を表す数値だと考えられます。 特に、カイ2乗は2つの項目に対称な値になり、そもそも順序関係を調べるのは無理なようです。 回帰係数や相関係数 と同様に「程度」を表す数字 総数Nを増やしても 識別力が変化しない 「ものさし」

本研究の概要(2) □ 分類したい項目間の関係 ア 項目j→項目kの順序関係が認められるもの イ 項目k→項目jの順序関係が認められるもの □ 分類したい項目間の関係 ア 項目j→項目kの順序関係が認められるもの イ 項目k→項目jの順序関係が認められるもの ウ 項目j,k間に双方向順序関係が認められるもの エ 項目j,k間の順序関係はないが,各々第3の項目lと順序関係があり,相関関係が認められるもの(いわゆる擬似相関) または,遠い順序関係にあるもの オ 項目j,k間には順序関係も相関関係もないもの(項目j,kは独立) j k j k j k 項目関連グラフを作るためには、順序性係数の値に応じて各項目間の関係を分類しておく必要があります。  先行研究では図のアイウオが登場しますが、エも含めるとすべての関係が分類できるのではないかと考えました。 k l j k j j k

エ イ j←k ア j→k ウ j←→k 本研究の概要(2) □ 順序性係数を用いた分類 (エを含めるとすべて分類できる:筆者の考え) オ □ 順序性係数を用いた分類 (エを含めるとすべて分類できる:筆者の考え) オ (独立) 無印 エ (擬似相関または遠い順序関係)・・・ イ j←k ア j→k ウ j←→k 第2の「しきい値」も考えるとすべての関係が分類できると考えられます。ただし、この分類「エ」はできたグラフから確認する程度で、あまり積極的に使うことはできませんでした。  といいますのは、理屈の上では「エ」が一般の場合で、アイウオがそのうち特別な場合を取り出したものになりますが、 (1) 「エ」の分類では、いわゆる擬似相関なのか遠い順序関係なのかを数値だけでは区別できません (2) 遠い順序関係でないときに擬似相関とするためには、観測項目でない潜在要因が必要になることがあり、本研究で想定している範囲を超えてしまう という事情があるためです。 ※本研究では const1=0.3 , const2=0.5 で計算

本研究の概要(3) 実データでの検証 確率・正答率データ 例2 Web教材の回答集計 実データでの検証 確率・正答率データ p50 p51 p53 p54 p55 p57 p60 p64 p67 p68 0.47 0.49 ・・ 0.50 1.07 0.27 1.43 0.20 0.41 0.19 0.43 0.84 0.26 0.68 0.23 0.61 0.45 0.65 0.88 0.18 0.16 0.57 0.24 0.66 0.56 0.59 0.60 0.14 0.25 0.31 0.71 0.35 0.48 0.37 例2 Web教材の回答集計 2010.2.1から2010.6.15の期間に回答のあった22,282件の答案のうち同一人物の重複回答を除く9,410人の回答から p50 p51 p53 p54 p55 p57 p60 p64 p67 p68 ・・・ → →  →   ←→ 個別の答案の件数 例えば64→68はN=89人のデータ 以上のように、検討した「確率」もしくは「正答率」データ上での順序性係数を、実データに当てはめて、適合性を調べたのが例2です。  これは、中学校1年生の比例・図形の答案を集計して、出題した頁間の関係を調べたものです。  上の表の・・は無相関ではねたもの、下の表の・・・は分類表のエで示した擬似相関ないしは遠い順序関係です 通常のテストと違い、Web教材では何百頁もある問題を全部解く人はおらず、ほとんどの人は幾つかの頁だけを解いています。特に、現役の中学生では習っていない単元はできませんので、6月段階で1年生の問題が解けるのは2年生以上ということになります。2年生はあまり参加してきませんので、実際には3年生または卒業生の理解構造を調べていることになります。

本研究の概要(3) 実データでの検証 確率・正答率データ IRSグラフ 68 67 64 57 54 55 60 53 50 51 例2 実データでの検証 確率・正答率データ 例2 による 立体の表面積 IRSグラフ 68 扇形の面積 立体の体積 67 64 反比例 反比例のグラフ 比例 比例 57 54 55 60 53 グラフにしたものです。 比例反比例グラフ 50 xy座標 51 xy座標 は項目番号

本研究の概要(3) 実データでの検証確率・正答率データ 38 28 18 IRSグラフ 34 31 24 21 41 22 速さと時間 例2と同じWeb教材 の回答集計 による 方程式(分数係数) 個別の答案の件数 例えば34→28はN=68人のデータ 38 式の値1 文字の使用 28 18 例3 前出の は、この1粒 例1 方程式 IRSグラフ 34 31 関係を表す式 同様にして、これは、中学校1年生の文字式・方程式の答案を集計して、出題した頁間の関係を調べたものです。 文字を使った式 速さと時間 1次方程式 24 21 41 文字を 使った式 は項目番号 22

□ まとめ □ 順序性係数を回帰係数で表し,データが確率である場合に拡張する可能性を探った. (確率→) (1,0データ→) □ まとめ □  順序性係数を回帰係数で表し,データが確率である場合に拡張する可能性を探った. (確率→) (1,0データ→)  相関係数との関係から順序性係数の有意性を判断した. (1,0データ→) (確率→)  データが確率である場合の順序性係数(試案)を実データに適用して,順序関係(因果関係)がどのくらい解明できるかを調べ,よい結果が得られた. 方程式(分数係数) 立体の表面積 38 扇形の面積 68 まとめです。  順序性係数を回帰係数で表し,データが確率である場合に拡張する可能性を探りました. 相関係数との関係から順序性係数の有意性を判断しました. データが確率である場合の順序性係数(試案)を実データに適用して,順序関係(因果関係)がどのくらい解明できるかを調べ,よい結果が得られました. 文字の使用 67 立体の体積 18 式の値1 28 64 反比例 のグラフ 例3 例2 反比例 54 34 方程式 57 55 60 比例 比例 31 関係を表す式 比例反比例 グラフ 文字を使った式 53 1次方程式 xy座標 速さと時間 50 21 41 24 xy座標 51 文字を使った式 22

□ ポイント □ ・・・確率データに順序性係数を適用する方法 (1) 変数を標準化せず、0≦p,q≦1の確率として使う(αを使うため) □ ポイント □ ・・・確率データに順序性係数を適用する方法 (1) 変数を標準化せず、0≦p,q≦1の確率として使う(αを使うため) できないものの例 身長と体重の関係 ←単位を変えても値域が0~1にならない できるものの例 アンケート項目間の関係 ←確率になるものは、構造が求められる       (ただし、本研究では潜在変数は使わない) (2) 順序性係数を回帰係数で表す (3) α(βp)とqの比によって順序性を解釈する が大きいと、pからqへの影響は小さい 数式や実データなどが多数出てきましたので、ポイントとなる部分だけを整理しておきますと 変数を標準化せずに、αを使うのが第1点です 順序性係数を回帰係数で表すのが第2点です 回帰係数とqの比によって順序性を解釈するというのが第3点です。 (逆に、小さいと    ・・・  大きい) 他の 分析方法 回帰係数βまたは相関係数 rによって影響の大小を判断(因果の「向き」は係数だけでは判断できない) 本研究 の大小で「向き」を判断