教育心理学に対するWeb統計の可能性 (その光と影) 香川大学経済学部 堀 啓造 日本教育心理学会第42回総会 2000年9月16日
教育心理学研究は 微妙な統計の有意差があるなしで論じるべきではない。 効果があるという場合, 大きな効果量(effect size)が必要であろう つまり,見たらわかるほどの違いがあって初めて意味がある変数(条件)といえる。
ただし,交互作用などの複雑な処理については統計学が必要な場合もある。 さらに,多変量解析は問題(課題)発見,探索としていい。また,尺度づくりに重要である。 臨床などの少数標本しかないとれない場合の統計処理こそ必要。
Web統計問題設定の例 (1)web 上の統計処理の利用 (2)web 上での統計学相談 (3)web 上での統計学学習・教育 (4)学習または研究レベルの論文を読む (5)統計パッケージの利用法など
WWWではどのようなことができるのか,私のホームページのリンク集を例にとって示す 統計ソフト・統計学習用データ
http://www.ec.kagawa-u.ac.jp/~hori/ statedu.html WWWで統計を学習しよう 検索系相談等|統計教育リンク|統計学用語集|case study(問題集)|統計学から分散分析・重回帰まで|総合的|特定分野 (統計教育・注意|研究法|歴史|測定|サンプリング|分布|検定力|…|グラフ化|本・論文案内 )|研究|雑誌|ソフト手引き(SPSS|SAS|…)| http://www.ec.kagawa-u.ac.jp/~hori/ statedu.html
統計ソフト・統計学習用データ |統計関係総合リンク|統計ソフト紹介関係|統計ソフト会社|共分散構造モデル|統計ソフト おもらい君|統計用データ|WWW上での統計処理|人|日本の統計学関係|日本のメーリングリスト| http://www.ec.kagawa-u.ac.jp/~hori/stat.html
日本のサイトでも漏れているものが多くなっている そこで,探索的因子分析に絞り,集めてみた。 この領域は研究としては枯れてきている。
探索的因子分析リンク集 ●用語辞典 ●Q&A ●わかりやすさをねらった説明 ●数式を使わないまたはほとんど使わない説明 ●数式を使う説明 ●advanced course ●本 ●手順の理解・アプリの説明+α(SAS SPSS) ●特定統計パッケージの説明または補説のみ(SPSS SAS STATA S-Plus R エクセル統計2000)
●因子分析データ集 ●プログラム・アルゴリズム ●実行プログラム ●WWW上で分析 ●先端分析実行 ●文献 ●メーリングリスト・相談系 ●因子分析利用研究 ●検索 http://www.ec.kagawa-u.ac.jp/~hori/spss/ factorlink.html
探索的因子分析そのものの評価 探索的因子分析は枯れてきて,新しい因子分析の本はでなくなってきている。 探索的因子分析は枯れてきて,新しい因子分析の本はでなくなってきている。 だが,検証的因子分析や共分散構造分析によって,新たな視点を得ている。 また,シミュレーションによる研究など無視できない成果がある。
Webの評価 WWWにある因子分析はちょっと古い段階のものが多い。 ∵紹介や授業用が多い また,日本のサイトには最新の考え方も紹介されている。 ただし,バランスよく学ぶには問題がある。現段階ではいくつかの本も学ぶ必要あり。 検索エンジンを使いこなせるようになること。 英語を読めるかで情報格差
相談のメディアとしてのWWW メーリングリスト (fpr, medsata,など領域別,spss-l, sas-l, statalist など統計パッケージ別) 掲示板 群馬大学青木繁伸先生主催の「統計学関連なんでもあり」(http://aoki2.si.gunma-u.ac.jp/lecture/ mb.html) など
相談系の基本問題 質問に対する回答(解答)があるかどうかは保証されません。 質問に対する回答(解答)があるかどうかは保証されません。 回答(解答)が正しいかどうかも保証されません。 (青木先生の「ご注意」から)
質問者側の問題点(1) 学校の宿題・卒論を訊く(大学授業料は?) 学校の宿題・卒論を訊く(大学授業料は?) 質問者のレベルや分野に関して適切な情報を与えない。 Ex.心理学をやっているとか数学をやっている。高校レベルの数学もできない。統計学をとりあえずは学んだ。
質問者側の問題点(2) 質問が大雑把すぎて何を訊きたいのかわからない。Ex. 仮説がない。因子分析について知りたい。 複数の回答を得たり,ある答えを得たときに,正しい答えもしくは適切な答えかどうかわからない。
回答者側の問題 答える者が少数になってしまう。 メーリングリストでも答える者がほとんど一人という状態が生じることがある。 問題をきちんと読まず単語に対して反応している。 何でも答えてしまう。 初心者に高度なことを教えてしまう問題。またはその人のレベルにあわない答え。 間違った答えをしてしまう。
教育心理学的可能性 質問や回答の仕方の批判的読みとり。 質問応答テクニックの学習 会話進行パタンの研究 FAQ(frequently asked questions)作成の資料 他の質問サイトであるように,回答を販売したり回答を評価し,回答者そのものを評価するシステムを作る。
統計学に起因する問題 統計学が複雑になっていっていて,単純な質問に答えることはできなくなっているものがある。 (次の論争とかさなる部分もある) 論争がかなりの頻度で起こる領域がある。反復測定の分散分析,多重比較。これは前提条件を満たさないのが当たり前。また混合要因で被験者数が不揃いの場合はさらに問題。
被験者間要因の水準を 多重比較をする場合 例えば familywise というのを絶対視していいのか? 2群で比較したときと5群を比較したとき 農学とか,薬学では反familywise を主張している研究者がいます。 これらは公理系の違いと言えよう。
被験者内要因の 分散分析・多重比較 分散分析の前提を満たさない場合が多い →球面性の問題 Q&A →球面性の問題 Q&A 混合要因の場合,被験者間要因内において被験者数が大きく異なる場合 →もっと大きな問題 ボンフェローニの方法で対応のあるt検定
メーリングリスト Survey からの統計学への問題提起 標本の大きさを決めて回収したときに,回収率が低いときにその統計的有効性は?回答者に質問内容と関連したバイアスがかかっていると考えられる場合。郵送調査 例えば,回収率30%のデータから母集団の比率を推計してもいいのか? 郵送調査において回収率30%と電話調査回収率60%を同等に扱って良いのか? 非標本誤差として扱うのでいいのか?
統計パッケージと WWWとのリンク SAS,SPSS,S-Plus, Stata などの統計パッケージはメーリングリストやホームページ上, e-mail などいろいろなサポートをしている。 今後もこの方面での活用はサポートは強化されるであろう。 ただ,ホームページはどんどん複雑になっていて,どこにいけば自分の思っているサービスを受けられるのかわかりにくくなっている。
統計パッケージ (1)みんなが使う統計・多変量解析をわかりやすく (SPSS, StatView, Statistica, Systat 等) (2)できるだけ多くの統計でしかも最新理論に基づいて( SAS) (3)行列言語を中心に,自分で組めるようにする( S, S-Plus, R, MacAnova 等) (4)特定分野を組み込む(S-Plus, TSP) (5)bootstrap や robust など新しい統計理論 (6)ユーザやスタッフがどんどん開発して追加していく(S, S-Plus, Stata等)