提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学)

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
検定 P.137.
男性の育児が肥満に与える影響 富山大学 経済学部 経済学科 孫田 篤 専門ゼミ-報告会.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学 第3回 「データの尺度・データの図示」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
4.「血液透析看護共通転院サマリーVer.2」 の説明
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
1DS04168E 梅根綾花 1DS04184E 清 泰裕 1DS04197P 福井千尋
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
母分散が既知あるいは大標本の 平均に関する統計的検定
フットサルシューズの最適化 ~コンジョイント分析を用いて~
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
離婚が出生数に与える影響 -都道府県データを用いた計量分析
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
4章までのまとめ ー 計量経済学 ー.
コードクローンに含まれるメソッド呼び出しの 変更度合の分析
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
二重課題による ワーキングメモリの増減  情報システム工学科3年 038 田中 祐史.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
中澤 港 統計学第4回 中澤 港
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
分散分析、判別分析、因子分析.
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
5.集計,ピボットテーブル(クロス集計表)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
ハザードマップの理解に対する ドリルマップ提示の効果
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学)

情報検索評価の枠組み レレバンス概念 レレバンス判定 検索手法の評価 利用者志向 レレバンス 主題的 レレバンス レレバンス判定そのものに関する研究は十分でない ⇒ (最近の情報環境下における)レレバンス判定について実験 ここでは判定尺度と提示順に焦点

レレバンス判定は一般的に 段階尺度 で行われる – 「レレバント」「ノンレレバント」 – 細かさにより2、3、5、7段階など Eisenberg ( 1988 ) “Measuring Relevance Judgment” – 段階尺度 と マグニチュード推定法 の 比較 ⇒ マグニチュード推定法 の方が自由度が高く 提示順などの影響を受けにくい 先行研究:判定尺度の影響 範囲をあまり定めずに 与えられた刺激を任意 の数値等で表現させる 制限の少ない尺度

先行研究:提示順の影響 順序効果 – 何らかの価値判断を行うときに提示順が影響 例)最高裁裁判官国民審査、料理コンテストなど Eisenberg & Barry ( 1988 ) “Order Effects : A Study of the Possible Influence of Presentation Order on User Judgment of Document Relevance” – 提示順別のレレバンス判定を比較 「大⇒小」過小評価 「小⇒大」過大評価 Parker ら( 1990 ) – 文献数が 15 件以下であれば影響はみられない

研究目的  既往研究の手法によるウェブの判定実験 レレバンス判定において *判定尺度による影響* *提示順の影響* が観察されるか 既往研究との違い – 提示順と判定尺度を関連させた分析 – ウェブシステムを使う 対象がインターネット上のニュース GUI 部品を使った判定尺度(スライダー)の追加 – 被験者数

被験者 – 亜細亜大学夏期司書講習の受講生 2回の実験 – 実験1-分析の中心となる実験 対象:2004年度受講生 検索質問:1問 提示文献数:10件x1問 – 実験2-追加的な実験 対象:2005年度受講生 検索質問:3問 提示文献数:6件x3問 実験環境

検索質問 インターネット上で新聞記事を探すとき にある程度の件数がヒットすると予想さ れる質問 利用者の欲しい文献、背景、検索に使わ れたキーワードから構成 質問例)

レレバンス判定の対象文献 検索質問のキーワードで実際に検索した記事 –Yahoo! NEWS 、 Google ニュース日本版 専門知識がなくとも判定可能な一般記事 あらかじめレレバンス評価を行い「大⇒小」順 「小⇒大」順、「混合」の3グループを用意

① 5 段階尺度 ②スライダー ③マグニチュード推定法

3種類の提示順 始 提示順①「大⇒小」 提示順②「小⇒大」 提示順③「混合」 終

実験の手順 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞

実験の手順 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞

実験の手順 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞

1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞 実験の手順 実験1では1問 実験2では3問 この時に判定尺度と提示 順を機械的に割り当て

1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞 実験の手順 実験1では10件 実験2では6件 実験1では1問 実験2では3問 この時に判定尺度と提示 順を機械的に割り当て

1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞 実験の手順 実験1では10件 実験2では6件

被験者の基本的属性 実験1実験2 性別 女性男性不明女性男性 年代 小計 総計

実験1(人数) 提示順 合計 大⇒小小⇒大混合 尺度 5 段階 スライダー マグニチュー ド 合計 実験2(延べ人数) 提示順 合計 大⇒小小⇒大混合 尺度 5 段階 スライダー マグニチュード 合計 被験者への割当て ほぼ同じ数 の被験者

判定尺度の正規化 各判定尺度での値は単位が異なるため比較ができ ない 個々の質問の判定間では判定基準は一定と仮定 最小値=0、最大値=1として各尺度の正規化

マグニチュード推定法の値について 「どのような値でも」と指示しているにも関わら ず 100 点満点にしている被験者が多い 全判定の 25.4% の最大値が 100 全判定の 47.2% の判定値が の範囲内 – 日本人独特の特性?あるいは指示の不徹底? マグニチュード推定法:参考値

判定尺度ごとの判定値分布 スライダー(とマグニチュー ド推定法)は5段階尺度と比 べ極端な値が多い

提示順の影響 Eisenberg らの研究と同様の形で分散分析 「大⇒小」「小⇒大」グループ間に差が見ら れるか ↓ 「大⇒小」「小⇒大」グループ間の分析では どの尺度も統計的に有意な差 –p 値の1%水準で「提示順グループ間の平均は等 しい」という帰無仮説を棄却 – 実験2でも同様の結果

既往研究との比較 Eisenberg らの研究との比較 – 5段階尺度 提示順の影響 → 同様の傾向 – マグニチュード推定法(*) 提示順の影響 → 異なる傾向 Parker らの研究との比較 – 少ない文献数でも提示順の影響 → 異なる傾向

5段階スライダー 小⇒大大⇒小小⇒大大⇒小 文献 文献 文献 文献 文献 文献 文献 文献 文献 文献 最大値 最小値 今回と Eisenberg らの研 究 ↓ 大⇒小:過小評価 同様の傾向 小⇒大:過大評価 5段階評価: 同様の傾向 スライダー:最小値では異なる傾向?

判定尺度と提示順:最小値頻度 最小値頻度 判定尺度 5段階スライダー マグニチュー ド 提示順提示順 大⇒小 4.83 回 2.82 回 2.94 回 小⇒大 3.53 回 3.00 回 2.44 回 混合 3.56 回 2.32 回 2.95 回 最小値頻度:ある質問の判定中に最小値が何回出現するか ≒下限への到達しやすさ

「大⇒小」最小値頻度の違い (イメージ図) 始終 提示順 スライダー 5段階 4.83 件 2.82 件 マグニチュード 2.94 件 大 小

まとめ レレバンス判定に関する判定実験を行い簡 単な分析を行った – 判定尺度間で異なる分布見られた – 提示順による違いが確認された – 5段階尺度は提示順により過大評価や過小評価、 最小値にすぐ到達するなどの傾向が見られた

今後の展開 実験データの整理とより高度な分析 マグニチュード推定法の判定値に関する 検討 判定時間の分析

提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学)

*インターネット上の検索システ ムあるいはブラウザによって キーワードをハイライト (黄色く色づけ) ⇒ キーワードを容易に識別 キーワードのハイライト

情報検索評価の枠組み レレバンス概念 レレバンス判定 検索手法の評価

主題的 レレバンス レレバン ス判定 検索手法の評価 利用者志向 レレバンス 質的研究 レレバンス判定そのものに関する研究は十分でない ⇒ (最近の情報環境下における)レレバンス判定について実験 具体的には判定尺度と提示順に焦点

発表の構成 本研究の背景 – レレバンス判定に関する研究の必要性 – 既往研究の成果 レレバンス判定実験 – 実験環境 – 実験結果 まとめ

判定尺度の影響 分散分析により5段階尺度、スライダー、マ グニチュード推定法(を正規化した値)の間 に差が見られるか ↓ 各尺度グループ間の分散分析で統計的に有意 な差 –p 値の1%水準で「各尺度グループ間の平均は等 しい」という帰無仮説を棄却 – 実験2でも同様の結果