分割表データの分析 With the help of Mr. Machida

Slides:

Advertisements

Similar presentations

１標本のｔ検定 3 年地理生態学研究室脇海道卓. ｔ検定とは・帰無仮説が正しいと仮定した場合に、統計量が t 分布に従うことを利用する統計学的検定法の総称である。

Advertisements

第６回適合度の検定問題例１サイコロを 60 回振って、各目の出た度数は次の通りであった。目の出方は一様と考えてよいか。サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説：サイコロの目は一様に出る＝＞それぞれの目の出る確率 p.

1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

1 ６章データ数不揃いの場合の分析アンバランス型（不釣合い型）の計画 ss2 や ss3 って何？

潜在クラス分析入門山口和範. 内容条件付独立シンプソンのパラドックス対数線形モデルにおける表現局所独立潜在変数モデル Lem 入門.

1 / 44 SPSS ハウツー独立行政法人大学入試センター橋本貴充 2007 年 3 月 30 日 ( 金 )

統計学入門２関係を探る方法講義のまとめ. 今日の話変数間の関係を探るクロス集計表の検定：独立性の検定散布図、相関係数講義のまとめとキーワード「統計学入門」後の関連講義・実習社会調査士.

1 調査データ分析 2003/5/27 第６回堀啓造（香川大学経済学部）. 2 課題 (1) 解答（１） Pearson のカイ２乗＝自由度＝ 1 漸近有意確率＝男女とコーヒー・紅茶の好みにおいて連関がない（ χ ２ (1)=0.084,p>0.05 ）。または.

エクセルと SPSS によるデータ分析の方法社会調査法・実習資料. 仮説の分析に使う代表的なモデル１クロス表２ｔ検定（平均値の差の検定）３相関係数.

数理統計学(第ニ回）期待値と分散浜田知久馬数理統計学第２回.

統計的仮説検定の手順と用語の説明代表的な統計的仮説検定ー標準正規分布を用いた検定、ｔ分布を用いた検定、無相関検定、カイ二乗検定の説明

寺尾敦青山学院大学社会情報学部 Fisher の直接確率法寺尾　敦青山学院大学社会情報学部

看護学部中澤港統計学第５回看護学部　中澤　港

データ分析入門（12）第12章　単回帰分析廣野元久.

第6回授業（5/17）での学習目標１.２.１実験計画法のひろがり（途中から）１.２.２節完全無作為化デザインをもっと知ろう

寺尾敦青山学院大学社会情報学部社会統計　第13回重回帰分析（第11章後半）寺尾　敦青山学院大学社会情報学部

行動計量学研究分野B4 町田透対数線形モデルによる分割表データの分析行動計量学研究分野B4 町田　透

第4章 MIXED Model 4.1 MIXED Model とは 4.2 反復測定データの分析１分割法タイプのデータ

Rによる回帰分析高崎経済大学宮田　庸一.

第1部一元配置分散分析：１つの条件による母平均の違いの検定第２部： 2つの条件の組み合わせによる二元配置分散分析

分散分析マスターへの道.

多変量解析　－重回帰分析－発表者：時田　陽一発表日：11月20日.

RコマンダーでANOVA 「理学療法」Vol28（7）のデータ

日本行動計量学会主催第４回春の合宿セミナー

実証分析の手順経済データ解析　2011年度.

市場調査の手順問題の設定調査方法の決定データ収集方法の決定データ収集の実行データ分析と解釈データ入力データ分析報告書の作成.

第１日目第２時限の学習目標基本的な１変量統計量（その２）について学ぶ。尺度水準と適切な統計量との関連を整理する。

第４回 (10/16) 授業の学習目標先輩の卒論の調査に協力する。２つの定量的変数間の関係を調べる最も簡単な方法は？

土木計画学第５回（１１月２日）調査データの統計処理と分析３担当：榊原　弘之.

Bassモデルにおける最尤法を用いたパラメータ推定

心理統計学 II 第７回 (11/13) 授業の学習目標相関係数のまとめと具体的な計算例の復習相関係数の実習.

第6章２つの平均値を比較する２つの平均値を比較する方法の説明　　　独立な2群の平均値差の検定　　対応のある2群の平均値差の検定.

初歩的情報リテラシーとアンケート集計のためのExcel・SPSS講座

確率･統計Ⅱ 第7回.

因子分析や３相因子分析による分析の問題点を整理する狩野裕＋原田章（行動工学講座）

質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---

第６章　数量化Ｉ類.

第3章重回帰分析ｰ計量経済学ｰ.

第3章重回帰分析ｰ計量経済学ｰ.

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

ロジスティック回帰分析 with the assistance of Mr. M. Torii

正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定

土木計画学第６回（１１月９日）調査データの統計処理と分析４担当：榊原　弘之.

analysis of survey data 第３回香川大学経済学部堀啓造

analysis of survey data 第２回堀啓造

市場調査の手順問題の設定調査方法の決定データ収集方法の決定データ収集の実行データ分析と解釈データ入力データ分析報告書の作成.

離婚が出生数に与える影響－都道府県データを用いた計量分析

看護研究における統計の活用法 Part １京都府立医科大学　浅野　弘明 2012年11月10日.

4章までのまとめｰ計量経済学ｰ.

確率論の基礎「ロジスティクス工学」第3章鞭効果第4章確率的在庫モデル補助資料

第１1回授業(12/11)の学習目標第８章分散分析 (ANOVA) の学習分散分析の例からその目的を理解する分散分析の各種のデザイン

多母集団の同時分析豊本満喜子大阪大学人間科学部.

第１０回授業（12/4)の目標カイ２乗検定の実習 WEB を用いたカイ２乗検定と、授業で行った検定結果の正誤の確認方法（宿題）

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

第１日目第３時限の学習目標２変量データを手にした時の分布の特徴の記述方法（前回からの続き）について学ぶ。基本的な２変量統計量ー１

再討論狩野裕（大阪大学人間科学部）.

部分的最小二乗回帰 Partial Least Squares Regression PLS

analysis of survey data 堀啓造

データの型量的データ質的データ数字で表現されるデータ身長、年収、得点カテゴリで表現されるデータ性別、職種、学歴

第3章　線形回帰モデル修士1年山田　孝太郎.

「アルゴリズムとプログラム」結果を統計的に正しく判断三学期第7回袖高の生徒ってどうよ調査(3)

情報経済システム論：第13回担当教員　黒田敏史 2019/5/7 情報経済システム論.

クロス表分析補遺。堀　啓造（香川大学経済学部） 2003年5月.

クロス表とχ2検定.

第３日目第４時限の学習目標第１日目第３時限のスライドによる、名義尺度２変数間の連関のカイ２乗統計量についての復習

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

確率と統計2007（最終回）平成20年1月17日(木) 東京工科大学亀田弘之.

第１日目第２時限の学習目標基本的な１変量統計量（その２）について学ぶ。尺度水準と適切な統計量との関連を整理する。

Presentation transcript:

分割表データの分析 With the help of Mr. Machida １．カイ２乗検定２．対数線形モデル

1.1 分割表とは 1.2 2×2分割表の分析 1.3 p×q分割表の分析１．カイ２乗検定 1.1 分割表とは 1.2 2×2分割表の分析 1.3 p×q分割表の分析

1.1 分割表とは

分割表とは対象者から得た“質的な”データを集計してまとめた表のことクロス表，集計表ともいう量的なデータでの散布図に対応もともと厳密な数値化が困難 or 不可能なデータ性別，血液型，出身地 etc･･･量的なデータからカテゴリーに分類することも尺度得点により「高群」・「低群」に分類 etc・・・クロス表，集計表ともいう

2次元分割表の具体例親が子どもに期待する最終学歴を調査性別(2)と希望学歴(4)の2×4分割表

2次元分割表の一般形

3次元分割表の具体例募金活動への参加意志を調査 VTRの有無(2), 性別(2), 参加意志(3)の2×2×3 分割表災害のVTRを視聴これ，分析しないの？田中敏（1996）実践心理データ解析

1.2 ２×２分割表の解析

２×２分割表の例 ---阪大人間科学部での調査---

二つの属性が関係ないとすると

比率で見ると

周辺確率との関係

検定方式二つの属性に関係がない二つの属性に何らかの関係がある

阪大人間科学部では

連関の強さの評価カイ2乗検定が有意になったとき odds 比=ad/bc=(a/b)/(c/d)=10.4 クラメールのV：

二項分布

多項分布

たこ焼きホームページ http://koko15.hus.osaka-u.ac.jp/~taco/goraku/recipe/ http://www.mesh.ne.jp/osaka/takoyaki/

SASプログラム Options nocenter; DATA taco1; DO region = '関西人', '非関西'; DO takoyaki = 'たこ焼き器あり', 'たこ焼き器なし'; INPUT num @@; OUTPUT; END; END; CARDS; 12 3 5 13 ; RUN; PROC PRINT; PROC FREQ DATA = taco1; WEIGHT num; TABLES region * takoyaki / CHISQ; RUN;

SAS出力（１） Obs region takoyaki num 1 関西人たこ焼き器あり 12 2 関西人たこ焼き器なし 3 Frequency| Percent | Row Pct | Col Pct |たこ焼き|たこ焼き| Total |器あり |器なし | ---------+--------+--------+ 関西人 | 12 | 3 | 15 | 36.36 | 9.09 | 45.45 | 80.00 | 20.00 | | 70.59 | 18.75 | 非関西 | 5 | 13 | 18 | 15.15 | 39.39 | 54.55 | 27.78 | 72.22 | | 29.41 | 81.25 | Total 17 16 33 51.52 48.48 100.00 SAS出力（１） Obs region takoyaki num 1 関西人たこ焼き器あり 12 2 関西人たこ焼き器なし 3 3 非関西たこ焼き器あり 5 4 非関西たこ焼き器なし 13

SAS出力（２） Statistics for Table of region by takoyaki Statistic DF Value Prob ------------------------------------------------------ Chi-Square 1 8.9335 0.0028 Likelihood Ratio Chi-Square 1 9.4350 0.0021 Continuity Adj. Chi-Square 1 6.9650 0.0083 Mantel-Haenszel Chi-Square 1 8.6627 0.0032 Phi Coefficient 0.5203 Contingency Coefficient 0.4616 Cramer's V 0.5203

SAS出力(3) Fisher's Exact Test ---------------------------------- Cell (1,1) Frequency (F) 12 Left-sided Pr <= F 0.9997 Right-sided Pr >= F 0.0036 Table Probability (P) 0.0033 Two-sided Pr <= P 0.0049 Sample Size = 33

解説 Table Prob= P(a=12)=0.0033 Right-sided Pr=P(a=12,13,14,15)=0.0036 Left-sided Pr=P(a=12,11,…1,0)=0.9997 Two-sided Pr =P(a=12,13,14,15)+P(a=4,3,..,0)=0.0049

まとめ基本はchi-squareの利用 nが小さいときにはFisher’s Exact Testを用いる最小二乗法系の統計量 LRは尤度にもとづく方法連続修正を施したchi-squareを用いるべきだという意見もあるが，nが大きいときは大差ない nが小さいときにはFisher’s Exact Testを用いる

注意点期待度数 Eij が 5 以下のセルが存在する場合対応出力結果に警告が表示 χ2分布への近似が悪くなるため WARNING: ** % of the cells have expected counts less than 5. Chi-Square may not be a valid test. χ2分布への近似が悪くなるため対応 Fisher’s Exact Test 意味が似たセルを結合研究目的から外れては無意味サンプル数を増やす

p×q 分割表の解析

実際例「あなたにとって，過去・現在・未来のうちで最も重要な意味をもつのはどれですか？」年齢層による違いはみられるか？

分析結果 Statistics for Table of age by time Statistic DF Value Prob ----------------------------------------------- Chi-Square 4 19.4288 0.0006 Likelihood Ratio Chi-Square 4 19.4515 0.0006 Mantel-Haenszel Chi-Square 1 18.2429 <.0001 Phi Coefficient 0.2766 Contingency Coefficient 0.2666 Cramer's V 0.1956

仮説と期待度数

検定の公式

χ2検定で有意のとき２つの変数は独立ではない関連の強さはどの程度？どのセルが有意性に“貢献”したのか？連関係数 p×q 分割表の場合，同定は難しい残差分析

連関の強さを表す指数

残差分析 χ2検定の事後分析（p×q 分割表）セルごとに「調整された残差」を算出どのセルが有意性に貢献したのかを判定 χ2検定が有意でないときは用いてはならないセルごとに「調整された残差」を算出残差＝観測度数－期待度数標準正規分布に従うように調整

残差分析の結果（SPSS）

Procedure Step 1) 期待度数 mij （H0のもとでの理論値）をもとに，各セルの「標準化された残差」 eij を求める Step 2) eij の分散 vij を求める Step 3) 各セルの「調整された残差」 dij を求める Step 4) dij が N (0,12) に近似的に従うことを利用し，　各セルの検討を行う

残差分析の結果（まとめ）青年期では過去指向は少なく，未来指向が多い老年期では逆の傾向がみられる

Further topics 独立性の検定と一様性の検定マンテル・ヘンツェル検定傾向性と対称性マクネマーの検定コクランのQ検定予測による連関の強さの評価

2.1 対数線形モデルの必要性 2.2 対数線形モデルの基礎：２変数の場合 2.3 シンプソンのパラドックス：３変数の場合２．対数線形モデル 2.1 対数線形モデルの必要性 2.2 対数線形モデルの基礎：　　２変数の場合 2.3 シンプソンのパラドックス：　　３変数の場合

2.1 対数線形モデルの必要性

対数線形モデルとは各セル度数の“対数値”がいくつかの要因効果に分解されると仮定モデル式は分散分析と酷似質的データの分散分析文献によっては，各セルの“確率”の対数値に線形モデルを当てはめていることもある

χ2検定の限界 χ2検定は “overall” な検定セルや変数の増加に伴い無力化得られる情報は分割表の全体的な傾向のみ where? 独立でないときにどのような情報が得られるかセルや変数の増加に伴い無力化 where? X Y Z related? where? where?

独立でないときのモデル化 χ2検定では“積”のモデルを仮定 H1のとき，どのように考えればよいのか？ 2変数A,Bが独立でないことによって生じる効果

対数線形モデルへ対数を取ると“積”が“和”になりANOVAの類型となる⇒対数線形モデル!!

シンプソンのパラドックス多元分割表において，以下の分析結果に矛盾が生じることその理解に対数線形モデルが極めて有効要因Aの水準ごとにB×Cの分割表を分析要因Aの水準を併合してB×Cの分割表を分析その理解に対数線形モデルが極めて有効

シンプソンのパラドックスの例 H14年度大学院入試問題１１．（行動データ科学）携帯電話を持つと男女別姓に賛成するのか？携帯電話の有無と男女別姓の賛否を聞いた調査で表１のデータを得た(仮想データ)．つぎに，回答者を年齢で層別したところ表２のようになった．表１表２

つづき (1) 上記の結果を解釈せよ． (2) 上記の「年齢」のように，調べたい要因に影響を及ぼす別の要因を剰余変数(extraneous variable)，または，第三変数という．観察データの分析では剰余変数に注意しなければならない．剰余変数を制御して実験・分析する方法として以下の(a), (b) (c) を考える．これらの相互比較を行い，適用するときの注意点を述べよ． (a) 年齢が一定のサンプルをとる． (b) 若年層，中高年層などのように年齢も要因として取り上げる． (c) 被験者をランダムに二分し，一方には携帯電話を持たせ他方には　　　　　　　　持たせない．一定期間後，男女別姓についての意見を問う． (3) (2)の (c) における実験で，なぜ年齢の影響が制御できているのか説明せよ． (4) 実験データの分析において標示因子と制御因子という区別がある．たとえば，性別の要因は標示因子であり，携帯電話を持たせるか持たせないかという要因は制御因子である．このような区別が意味をもつ理由を説明せよ．

CATMOD procedure Categorical (Data) Modeling いくつかの質的変数間の関係を分散分析のように分析するためのツール対数線形モデルはCATMODをつかう多項のロジスティック回帰分析もできる

2.2 対数線形モデルの基礎：２変数の場合 2変数－対数線形モデルの導入 p×q 分割表の再分析 SASによる分析例―PROC CATMOD

記号

独立性を表す対数線形モデル（２変数）

独立でないモデル 2次元分割表で考えられる全ての効果を含むこれ以上新たな項は導入不可能　⇒「飽和モデル」(saturated model)

2要因分散分析との対応

「主効果」の意味 Aの主効果が存在　　⇒Aのカテゴリーによって対数セル度数の平均が　　（有意に）異なる Bは考慮に入れない　（Aのみで集計）

「交互作用」の意味 AとBの交互作用が存在 ⇒Bのカテゴリーによって，Aのカテゴリーによる対数セル度数の変動の様子が（有意に）異なる

「交互作用」の意味 AとBの交互作用がある AとBが関連している Aの水準によってBの効果が異なる年齢層によって重視する時間が異なる

なぜ度数の「対数」なのか交互作用度数の場合： (a-c)-(b-d) 対数値の場合： a b c d

SASプログラム 2－1 （DATAステップ） DATA loglin2; DO age = 1 TO 3; DO time = 1 TO 3; INPUT num @@; OUTPUT; END; END; CARDS; 28 34 46 24 22 18 45 21 16 ; RUN; (Continued on PROC step) SASプログラム 2－1 （DATAステップ） age = 1は青年期，2は成人期， 3は老年期 time = 1は過去，2は現在， 3は未来

度数ゼロのセルを含む場合 ⇒明らかにまずいゼロに近い正の数に置き換える（可能な限りは）サンプル数の増加が無難 … 　　　　　　　 ⇒明らかにまずいゼロに近い正の数に置き換える（可能な限りは）サンプル数の増加が無難 … INPUT num @@; IF num = 0 THEN num = 0.5; /* num = 0 のときは 0.5 に置き換える */ OUTPUT;

SASプログラム 2－1 （PROCステップ） (Continued from DATA step) PROC CATMOD DATA = loglin2; WEIGHT num; MODEL age * time = _RESPONSE_ ; /* _RESPONSE_により対数線形モデルを指定 */ LOGLIN age | time; /* 　モデルに投入する要因変数を指定 */ RUN;

変数の効果(飽和モデル) 各変数の主効果・交互作用について有意性を検討飽和モデル：すべての変数を含めたモデル MAXIMUM-LIKELIHOOD ANALYSIS-OF-VARIANCE TABLE Source DF Chi-Square Prob -------------------------------------------------- AGE 2 11.43 0.0033 TIME 2 3.38 0.1843 AGE*TIME 4 18.62 0.0009 LIKELIHOOD RATIO 0 . . 各変数の主効果・交互作用について有意性を検討飽和モデル：すべての変数を含めたモデル飽和モデルではLIKELIHOOD RATIOは無視してよい

モデルのルール多くの不飽和モデルが考えられる階層の原則(hierarchy principle) モデルが高次の交互作用を含むときは，そのなかの変数による低次の効果も“必ず”含む　　　　を含める⇒　　　　　も“必ず”含める

不飽和モデルの検討方法尤度比カイ2乗統計量G 2 は小さいほど良い ⇔ p が大きいほど良い 2変数間に Source DF Chi-Square Prob -------------------------------------------------- LIKELIHOOD RATIO 4 19.45 0.0006 尤度比カイ2乗統計量G 2 は　　　　　　　　　小さいほど良いモデルの当てはまりの“悪さ”を示す ⇔ p が大きいほど良いモデルが正しいときに，観測されたデータが発生する可能性（0.10以上が望ましい） 2変数間に独立性を仮定

モデルの適合度「階層の原則」に従い，高次の項から順に 0 とおいてみる不飽和モデルはどれも適合が悪い

パラメータの推定値出力結果は不十分：残りのパラメータは？ ANALYSIS OF MAXIMUM-LIKELIHOOD ESTIMATES Standard Chi- Effect Parameter Estimate Error Square Prob ---------------------------------------------------------------- AGE 1 0.2879 0.0877 10.79 0.0010 2 -0.2213 0.0988 5.02 0.0250 TIME 3 0.1645 0.0903 3.32 0.0686 4 -0.0539 0.0949 0.32 0.5704 AGE*TIME 5 -0.3947 0.1239 10.15 0.0014 6 0.0178 0.1245 0.02 0.8862 7 -0.0396 0.1344 0.09 0.7684 8 0.0917 0.1391 0.44 0.5095 パラメータは辞書順に並んでいる．出力結果は不十分：残りのパラメータは？

Birchの制約式（2変数）各効果におけるパラメータの総和は“0” CATMODプロシージャでは，パラメータは番号の小さい順に出力最後の項は出力されない

パラメータの推定値残りのパラメータは　のようにして求める

分割表を併用したまとめ方未検定を表示 ※　　　部分のセルは未検定（＝n.s.とは限らない）

交互作用の推定値独立モデルからのズレを表す |交互作用|が大きいことは独立モデルから外れていることを示す必ずしも，頻度が高い(低い)ことを意味しない

層別(行別)に比較する交互作用推定値青年層成人層老年層

＋⇒more frequency －⇒less frequency 解釈のレシピ解釈は交互作用から主効果の解釈にはあまり関心がない属性間・条件間の度数の違いを表すのみ（有意性に加えて）パラメータの“符号”も重要プラス⇒独立モデルと比してより多い頻度マイナス⇒独立モデルと比してより少ない頻度＋⇒more frequency　－⇒less frequency

まとめ２変数・多カテゴリーの分割表データの対数線形モデルによる分析実用上のススメ独立からの「ずれ」をモデリングして情報を得る「カイ２乗検定＋残差分析」とほぼ同様の分析結果実用上のススメ SAS．．．．対数線形モデル SPSS．．．カイ２乗検定＋残差分析

2.3 シンプソンのパラドックス：３変数の場合対数線形モデルの真骨頂

3変数の対数線形モデル 3変数の飽和モデル (i, j, k) セルの組み合わせによる効果

例１：教科書的例

Simpson’s Paradox 多次元分割表で，変数をむやみに“つぶす” (collapse)のは危険!! 層別にみると“関連なし”⇔全体では“関連あり” 層別にみると“関連あり”⇔全体では“関連なし” 　・・・？？？多次元分割表は，多次元のままで分析するのが基本 ⇒ 対数線形モデル

SASプログラム DATA keitai; INPUT age keitai bessei freq; CARDS; 1 1 1 2 1 1 0 8 1 0 1 20 1 0 0 80 0 1 1 80 0 1 0 20 0 0 1 8 0 0 0 2 ; PROC CATMOD DATA=keitai; WEIGHT freq; MODEL age*keitai*bessei = _RESPONSE_; LOGLIN age|keitai|bessei; RUN; SASプログラム

例１：対数線形モデル分析結果 Source DF EST χ2 Prob --------------------------------------------- AGE 1 0 0.00 1.0000 KEITAI 1 0 0.00 1.0000 AGE*KEITAI 1 -1.15 61.71 0.0000 BESSEI 1 0 0.00 1.0000 AGE*BESSEI 1 -0.69 22.37 0.0000 KEITAI*BESSEI 1 0 0.00 1.0000 AGE*KEITAI*BESSEI 1 0 0.00 1.0000 注意：実は，本データに対数線形モデルを適用するにはセル度数が少なすぎる

例１：図示すると携帯男女別姓年齢男女別姓携帯年齢

条件付独立

パラメータの推定値

補遺：なぜ対数かなぜ度数ではなく対数値をつかうのか全体のデータ（度数）　　　若年層のデータ（度数）

度数の対数のプロットと交互作用全体のデータ　　　　　　　　　　　若年層のデータ

対数がよい交互作用度数の場合： (a-c)-(b-d) 対数値の場合： a b c d

例２：教科書的例機械によって不良品の出方に違いがあるかどうかを調べたい

例２：対数線形モデル分析結果 Source DF EST χ2 Prob ---------------------------------------------- WORKER 1 0.00 0.00 1.0000 KIKAI 1 0.00 0.00 1.0000 WORKER*KIKAI 1 0.00 0.00 1.0000 DEFAULT 1 0.00 0.00 1.0000 WORKER*DEFAULT 1 0.00 0.00 1.0000 KIKAI*DEFAULT 1 0.00 0.00 1.0000 WORKER*KIKAI*DEFAULT 1 -0.42 60.32 0.0000

例２：図示すると作業者A 機械 a 良・不良作業者良・不良機械機械と作業者の交互作用がある作業者B 機械 -a 良・不良

２次交互作用

例３：実際のデータ Hot Hand 現象は真か？バスケットのフリースローで1回目に成功すると2回目の成功確率が上がる？！

例３：カイ２乗検定結果

例３：対数線形モデル分析結果 Source DF χ2 Prob ーーーーーーーーーーーーーーーーーーーーー player 1 0.44 0.5077 first 1 41.95 <.0001 player*first 1 30.84 <.0001 second 1 73.71 <.0001 player*second 1 33.28 <.0001 first*second 1 0.33 0.5641 player*first*second 1 0.09 0.7580

例３：プーリング後の分析結果 Source DF -Square > ChiSq --------------------------------------- player 1 0.24 0.6266 first 1 71.51 <.0001 second 1 112.60 <.0001 player*first 1 52.61 <.0001 player*second 1 49.25 <.0001 Likelihood Ratio 2 0.35 0.8392

例３：図示すると１回目２回目プレイヤの実力２回目１回目プレイヤの実力

例４：時間的展望見通しがあると毎日が充実？「将来展望（将来の見通し）の有無」と「毎日の生活への満足感」を調査 χ2検定は高度に有意 χ2(1) = 8.73, p = 0.003**

Really ? 将来展望の確立は青年期の中心的課題しかし，「未来指向＝適応的」とは限らない「将来の目標はあるが，実現できるか不安」「今が楽しいから別にそれでいい」将来の見通しの有無が，個人にとってどのような意味をもつのかによって，現在への満足感は異なるのではないか？

層別に分析「将来展望の獲得が個人にとって重要な意味をもつかどうか」も考慮してみる ⇒χ2検定はどちらも有意でない「将来展望の獲得」が重要な群 ⇒χ2(1) = 0.09, p = 0.76 (n.s.) 「将来展望の獲得が個人にとって重要な意味をもつかどうか」も考慮してみる ⇒χ2検定はどちらも有意でない「将来展望の獲得」が重要でない群 ⇒χ2(1) = 0.01, p = 0.92 (n.s.)

・・・？？？ ⇒ ⇒AとBは“関連なし” ⇒AとBは“関連あり” ⇒AとBは“関連なし” C = 1 B 合計 1 2 A 146 42 188 34 11 45 180 53 233 ・・・？？？ C = 1,2 B 合計 1 2 A 180 82 262 90 75 165 270 157 427 ⇒AとBは“関連なし” ⇒ C = 2 B 合計 1 2 A 34 40 74 56 64 120 90 104 194 ⇒AとBは“関連あり” ⇒AとBは“関連なし”

3次元分割表として対数線形モデル分析将来展望の有無とその重要性，毎日の生活への満足感の間にはどのような関連がみられるか？　

例４：分析結果（飽和モデル） Source DF x^2 Prob ------------------------------------------- MEANING 1 2.38 0.1229 GOAL 1 13.99 0.0002 MEANING*GOAL 1 59.38 0.0000 SATISFY 1 18.08 0.0000 MEANING*SATISFY 1 29.86 0.0000 GOAL*SATISFY 1 0.03 0.8563 MEANING*GOAL*SATISFY 1 0.09 0.7644 LIKELIHOOD RATIO 0 . .

探索的にモデルを選択 ○ ◎

出力結果 ([AC][BC]) 各変数・各セルの有意性を検討出力結果は不十分 MAXIMUM-LIKELIHOOD ANALYSIS-OF-VARIANCE TABLE Source DF Chi-Square Prob -------------------------------------------------- MEANING 1 2.76 0.0967 GOAL 1 18.13 0.0000 MEANING*GOAL 1 74.11 0.0000 SATISFY 1 25.74 0.0000 MEANING*SATISFY 1 41.40 0.0000 LIKELIHOOD RATIO 2 0.10 0.9513 出力結果 ([AC][BC]) 各変数・各セルの有意性を検討出力結果は不十分 ANALYSIS OF MAXIMUM-LIKELIHOOD ESTIMATES Standard Chi- Effect Parameter Estimate Error Square Prob ---------------------------------------------------------------- MEANING 1 -0.0989 0.0596 2.76 0.0967 GOAL 2 0.2366 0.0556 18.13 0.0000 MEANING*GOAL 3 0.4783 0.0556 74.11 0.0000 SATISFY 4 0.2695 0.0531 25.74 0.0000 MEANING*SATISFY 5 0.3418 0.0531 41.40 0.0000

分析結果（まとめ）＋⇒more frequency －⇒less frequency 残りのパラメータはBirchの制約式から求める独立変数の主効果や独立変数どうしの交互作用はあまり情報をもたない

モデルの解釈 ??? 将来の見通しがあることが，直ちに毎日の充実感に結びつくわけではない毎日の生活への満足感将来展望の確立将来の見通しがあることが，直ちに毎日の充実感に結びつくわけではない「将来展望の獲得が個人にとってどのような意味をもつか」を考慮すると，「将来展望の有無」と「毎日の生活への満足感」は無関係将来展望の重要性毎日の生活への満足感確立

PRED = FREQ オプションによる出力観測度数と理論度数，残差の算出を指定 MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND FREQUENCIES -------Observed------- -------Predicted------ Function Standard Standard Sample Number Function Error Function Error Residual -------------------------------------------------------------------------- F1 146 9.80202149 145.236051 9.45813167 0.76394854 F2 42 6.15376734 42.7639485 5.6657935 -0.7639485 F3 34 5.59399142 34.7639485 5.05506267 -0.7639485 F4 11 3.27362607 10.2360515 1.90007772 0.7639485 F5 34 5.59399142 34.3298969 4.49294853 -0.3298969 F6 40 6.02104039 39.6701031 4.95996877 0.32989689 F7 56 6.97536649 55.6701031 6.08508417 0.3298969 F8 64 7.37614358 64.3298969 6.57676534 -0.3298969 RESPONSE PROFILES Response MEANING GOAL SATISFY -------------------------------- 1 1 1 1 2 1 1 2 3 1 2 1 4 1 2 2 … … … … PRED = FREQ オプションによる出力観測度数と理論度数，残差の算出を指定 Function Number は Response に対応している

例５：実験データの例街頭募金活動への参加意志を調査災害のVTR VTRの有無性別募金活動への参加意志合計不参加一時的参加全面的参加 VTR視聴群男性 16 21 9 46 女性 7 32 12 51 統制群 31 11 4 29 3 48 83 80 28 191 田中敏（1996）実践心理データ解析

Graphical Display

対数セル度数のプロット 2次交互作用の存在は微妙？

SASプログラム（DATAステップ & PROCステップ） DATA fund; DO vtr = “y”, “n”; DO gender = “m”, “f”; DO concern = 1 TO 3; INPUT num @@; OUTPUT; END; END; END; CARDS; 16 21 9 7 32 12 31 11 4 29 16 3 ; RUN; SASプログラム（DATAステップ & PROCステップ） vtr = y はVTR視聴群，n は統制群 gender = m は男性，f は女性 concern = 1 は不参加，2 は一時的参加， 3 は全面的参加 PROC CATMOD DATA = fund; WEIGHT num; MODEL vtr * gender * concern = _RESPONSE_; LOGLIN vtr | gender | concern; RUN;

要因効果の検討（飽和モデル） MAXIMUM-LIKELIHOOD ANALYSIS-OF-VARIANCE TABLE Source DF Chi-Square Prob -------------------------------------------------- VTR 1 1.65 0.1990 GENDER 1 0.01 0.9314 VTR*GENDER 1 0.01 0.9029 CONCERN 2 21.88 0.0000 VTR*CONCERN 2 29.78 0.0000 GENDER*CONCERN 2 5.66 0.0591 VTR*GENDER*CONCERN 2 2.19 0.3350 LIKELIHOOD RATIO 0 . .

探索的にモデルを選択(1/2) DF Chi–Square Prob（LRのみ）モデル [VGC] [VG][GC][VC] VTR 1　　1.65 1　　2.24 GENDER 1　　0.01 1　　0.42 CONCERN 2　　21.28*** 2　　22.45*** V×G G×C 2　　5.66† 2　　4.84† V×C 2　　29.78*** 2　　29.75*** V×G×C 2　　2.19 Likelihood Ratio － 2　　2.24 　 0.3269 DF　Chi–Square Prob（LRのみ）

探索的にモデルを選択(2/2) モデル [VC][GC] [VC][G] [VC] VTR 1 2.16 1 2.16 GENDER 1　　 2.16 1　　2.16 GENDER 1　　 0.32 1　　 0.26 CONCERN 2　　22.58*** 2　　23.25*** V×G G×C 2　　 4.51 V×C 2　　29.67*** V×G×C Likelihood Ratio 3　　 2.66 0.4467 5　　 7.23 0.2039 6　　 7.49 0.2780

モデル評価のまとめどのモデルも適合は良い(see p 値) AICによると[VC]がよい Genderの交互作用がないので，男女の層をつぶしてよい

男女の層を合併

出力結果([VC]) RESPONSE PROFILES Response VTR GENDER CONCERN ------------------------------ 1 n f 1 2 n f 2 3 n f 3 4 n m 1 5 n m 2 6 n m 3 出力結果([VC]) Response VTR GENDER CONCERN ------------------------------ 7 y f 1 8 y f 2 9 y f 3 10 y m 1 11 y m 2 12 y m 3 ANALYSIS OF MAXIMUM-LIKELIHOOD ESTIMATES Standard Chi- Effect Parameter Estimate Error Square Prob ---------------------------------------------------------------- VTR 1 -0.1357 0.0923 2.16 0.1414 CONCERN 2 0.3672 0.1163 9.97 0.0016 3 0.3853 0.1148 11.27 0.0008 VTR*CONCERN 4 0.6151 0.1163 27.97 0.0000 5 -0.2015 0.1148 3.08 0.0791

部分のセルは未検定（= n.s.とは限らない）募金活動への参加意志合計不参加(1) 一時的参加(2) 全面的参加(3) VTR VTR視聴群(y) 23 (-0.6151***) 53 (0.2015†) 21 (0.4136**) 97 (-0.1357) 統制群(n) 60 (0.6151***) 27 (-0.2015†) 7 (-0.4136**) 94 (0.1357) 83 (0.3672**) 80 (0.3853***) 28 (-0.7525***) 191 　　　部分のセルは未検定（= n.s.とは限らない）（SASでは）文字型変数をアルファベット順に読み込むため Birchの制約式 or 記号の割り当て方を変更し再び“RUN” （例）① y → 1, n → 2，② 不参加→3，全面的→1，③ ①＋②

The final model VTRの視聴が募金活動への参加意志に（有意に）影響 VTR 参加意志性別 VTR視聴群統制群では逆の傾向「不参加」が負で有意「全面的」が正で有意統制群では逆の傾向性別の効果はなし VTR 参加意志性別

対数線形モデル（３変数）のまとめ２変数の分割表の分析に帰着できない場合が多々ある第３変数の関わりを分析するためには対数線形モデルが極めて有効第３変数の関わり方によって多くのモデルがあるそれらの中からベストなモデルを選択する

3変数でのモデル「階層の原則」に従っても“19種類” 飽和モデル・・・[ABC] 2次交互作用 = 0 ・・・[AB][AC][BC] 条件つき独立性・・・[AB][AC] etc A を与えたもとで B,C は独立同時独立性・・・[A][BC] etc B (or C) を“つぶす”と，A,C (or B) は独立完全独立性・・・[A][B][C]

図示すると A A A A B C B C B C B C ２次交互作用＝0 条件付独立同時独立完全独立２次交互作用＝0　条件付独立　　　同時独立　　　　完全独立 [AB][BC][AC] [AB][AC] [A][BC] [A][B][C]

分析の手順のまとめ Step 1) まず飽和モデルを適用 Step 2) 2次交互作用を 0 とおいてみるモデルの適合度をCheck ( p > 0.10? ) 適合せず⇒飽和モデル（階層の原則） Step 3) さらに，有意でない変数を 0 とおいてみるモデルが棄却されないこと (p>0.10) パラメータが少ない（自由度が大きい）モデルがよい AICの利用ただし理論的な根拠，実質科学的な考察が重要 Step 4) モデルの解釈＆各セルの効果の検討

References B.S.Everitt　1992　The Analysis of Contingency Tables　Second Edition　CHAPMAN & HALL / CRC 海保博之　1986　心理・教育データの解析法10講　 ■応用編■　　　福村出版松田紀之　1988　質的情報の多変量解析　朝倉書店 SAS インスティチュートジャパン　1993　SAS / STAT ソフトウェア：ユーザーズガイド　Version 6 First Edition 田中敏，山際勇一郎　1992　ユーザーのための教育・心理統計と実験計画法　教育出版