周育佳 東京外国語大学地域文化研究科博士後期課程

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
1 項目反応理論によるテストの作成 東京工業大学 大学院社会理工学研究科 前川 眞一.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
「CBT 技法研究会」(柳本武美先生の研究会) 「CBT 技法研究会」 コメント 林 篤裕 (大学入試センター研究開発部)
グラフィカル多変量解析 ----目で見る共分散構造分析----
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
測定の標準誤差: 1点の差には意味があるか Rie Koizumi 小泉 利恵.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
動機 目的 音声特徴比較システムの開発 結果を考察 サンプルデータ の収集及び統計 班員全員が音楽好き 歌の上手さを科学的に理解
Toshihiko SHIOTSU 塩津敏彦
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
Bassモデルにおける 最尤法を用いたパラメータ推定
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
応用言語学研究論A:SPSS宿題 Spring 2016 R.Nishida, Ph.D..
タレントの魅力測定とその分析.
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
行動計量分析 Behavioral Analysis
3章 Analysing averages and frequencies (前半 p )
統計学 第3回 10/11 担当:鈴木智也.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
社会福祉調査論 第9講 母集団の推計 12月14日.
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
ニューラルテスト理論を利用した 教科テストの Can-do table 作成
疫学概論 測定の信頼性 Lesson 20. 評価の要件 §B. 測定の信頼性 S.Harano, MD,PhD,MPH.
神戸大学大学院法学研究科 博士課程後期課程
春の統計学・計量経済学勉強会 第1回:2017年2月21日(火) 市野泰和
統計学の基礎と応用 張 南   今日の話:序   論          履修の注意事項.
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散
二重課題による ワーキングメモリの増減  情報システム工学科3年 038 田中 祐史.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
統計学 西 山.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
尺度化について 狩野 裕 大阪大学人間科学部.
疫学概論 測定の信頼性 Lesson 20. 評価の要件 §B. 測定の信頼性 S.Harano, MD,PhD,MPH.
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
ベイズ・アプローチによる グラフィカル・テスト理論
誤 差 誤差 = 測定値 - 真値 ・真値は神様だけが知っている。 ・ばらつきの程度を表す意味が薄い。
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
ウィルスって どの位感染しているのかな? 菊池研究室  小堀智弘.
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
ニューラルテスト理論分析ソフト「neutet」の特徴と使い方
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
システムとソフトウェア評価: 標準化の目的と必要性
1変量データの記述 (度数分布表とヒストグラム)
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
数理統計学  第6回 西山.
LRTモデルに基づくCATの開発と シミュレーションによる特性解析
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
SDQ-S利用上の問題点と精度の高い方向感覚測定法の確立に向けて
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Presentation transcript:

周育佳 東京外国語大学地域文化研究科博士後期課程 テスト統計の理論的概略 周育佳 東京外国語大学地域文化研究科博士後期課程

概 要 古典的テスト理論 項目応答理論

古典的テスト理論の基盤 テストの得点の求め方 素点(raw score) =正答数に基づく得点である。

テストが難しいとは? 項目困難度: ⇒正答率=正答者数/受験者総数

能力が低いとは? 本当に能力がないのか?   それとも、テストが難しいからか? 偏差値の使用

項目弁別力(1) 項目弁別力 ⇒ある項目が能力の高い受験者とそうでない受験者を弁別することができる度合いである。 計算方法     ①=上位27%の受験者の正解率ー下位27%の受験者の正解率

項目弁別力(2) 点双列相関係数 =item-total Pearson r すべてのデータを用いて、算出する方法。 テスト総得点が高いものは、それぞれの項目でも正解を出しているかどうか

古典テスト理論の限界(1) 1.テスト依存 -受験者の能力は、テストの困難度を考えずに、定義できない。(テスト点数とは、正解したテストの項目の数) 2.項目の困難度は、受験者に依存 -項目の難易度は、そのテストを受ける受験者によって、決定される。(項目困難度=正解率) ⇒受験者の能力と項目の難易度の測定は、切り離せない。

古典的テスト理論信頼性 テスト得点の安定性である。 観測された得点=真の得点+誤差得点 信頼性係数=真の得点の分散/観測された得点の分散  テスト得点の安定性である。 観測された得点=真の得点+誤差得点 信頼性係数=真の得点の分散/観測された得点の分散   (真の得点の分散が、観測スコアに占める割合。)

項目応答理論 古典的テスト理論の欠点を克服するために、開発されました。 応用:大規模テストが多い。 TOEFL, GREなど。 特徴:受験者能力と項目困難度が共通尺度で表される。 (-3~3) (図)

項目応答理論特徴(1) Test-free person measurement   どんな異なったテストを用いても共通の尺度上で能力測定が可能。

項目応答理論特徴(2) Sample-free item calibration  どんな受験者集団に実施しても、共通の項目特性(項目困難度、項目弁別力など)に関する値を求めることが可能。ちなみに、これらは、受験者集団とは、独立して求めることができる。