Presentation is loading. Please wait.

Presentation is loading. Please wait.

提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学)

Similar presentations


Presentation on theme: "提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学)"— Presentation transcript:

1 提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学) agata@asia-u.ac.jp http://itasan.mydns.jp/

2 情報検索評価の枠組み レレバンス概念 レレバンス判定 検索手法の評価 利用者志向 レレバンス 主題的 レレバンス レレバンス判定そのものに関する研究は十分でない ⇒ (最近の情報環境下における)レレバンス判定について実験 ここでは判定尺度と提示順に焦点

3 レレバンス判定は一般的に 段階尺度 で行われる – 「レレバント」「ノンレレバント」 – 細かさにより2、3、5、7段階など Eisenberg ( 1988 ) “Measuring Relevance Judgment” – 段階尺度 と マグニチュード推定法 の 比較 ⇒ マグニチュード推定法 の方が自由度が高く 提示順などの影響を受けにくい 先行研究:判定尺度の影響 範囲をあまり定めずに 与えられた刺激を任意 の数値等で表現させる 制限の少ない尺度

4 先行研究:提示順の影響 順序効果 – 何らかの価値判断を行うときに提示順が影響 例)最高裁裁判官国民審査、料理コンテストなど Eisenberg & Barry ( 1988 ) “Order Effects : A Study of the Possible Influence of Presentation Order on User Judgment of Document Relevance” – 提示順別のレレバンス判定を比較 「大⇒小」過小評価 「小⇒大」過大評価 Parker ら( 1990 ) – 文献数が 15 件以下であれば影響はみられない

5 研究目的  既往研究の手法によるウェブの判定実験 レレバンス判定において *判定尺度による影響* *提示順の影響* が観察されるか 既往研究との違い – 提示順と判定尺度を関連させた分析 – ウェブシステムを使う 対象がインターネット上のニュース GUI 部品を使った判定尺度(スライダー)の追加 – 被験者数

6 被験者 – 亜細亜大学夏期司書講習の受講生 2回の実験 – 実験1-分析の中心となる実験 対象:2004年度受講生 検索質問:1問 提示文献数:10件x1問 – 実験2-追加的な実験 対象:2005年度受講生 検索質問:3問 提示文献数:6件x3問 実験環境

7 検索質問 インターネット上で新聞記事を探すとき にある程度の件数がヒットすると予想さ れる質問 利用者の欲しい文献、背景、検索に使わ れたキーワードから構成 質問例)

8 レレバンス判定の対象文献 検索質問のキーワードで実際に検索した記事 –Yahoo! NEWS 、 Google ニュース日本版 専門知識がなくとも判定可能な一般記事 あらかじめレレバンス評価を行い「大⇒小」順 「小⇒大」順、「混合」の3グループを用意

9 ① 5 段階尺度 ②スライダー ③マグニチュード推定法

10 3種類の提示順 始 提示順①「大⇒小」 提示順②「小⇒大」 提示順③「混合」 終

11 実験の手順 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞

12 実験の手順 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞

13 実験の手順 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞

14 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞 実験の手順 実験1では1問 実験2では3問 この時に判定尺度と提示 順を機械的に割り当て

15 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞 実験の手順 実験1では10件 実験2では6件 実験1では1問 実験2では3問 この時に判定尺度と提示 順を機械的に割り当て

16 1. システムへアクセス 2. 実験の説明 3. 基本的な属性の入力 4. 検索質問の説明 5. レレバンス判定 6. 協力への謝辞 実験の手順 実験1では10件 実験2では6件

17 被験者の基本的属性 実験1実験2 性別 女性男性不明女性男性 年代 20722606426 302751156 40147083 5074031 小計 1204219036 総計 163126

18 実験1(人数) 提示順 合計 大⇒小小⇒大混合 尺度 5 段階 18171853 スライダー 1719 55 マグニチュー ド 18 1955 合計 535456163 実験2(延べ人数) 提示順 合計 大⇒小小⇒大混合 尺度 5 段階 454442131 スライダー 434041124 マグニチュード 404139120 合計 128125122375 被験者への割当て ほぼ同じ数 の被験者

19 判定尺度の正規化 各判定尺度での値は単位が異なるため比較ができ ない 個々の質問の判定間では判定基準は一定と仮定 最小値=0、最大値=1として各尺度の正規化

20 マグニチュード推定法の値について 「どのような値でも」と指示しているにも関わら ず 100 点満点にしている被験者が多い 全判定の 25.4% の最大値が 100 全判定の 47.2% の判定値が 0-100 の範囲内 – 日本人独特の特性?あるいは指示の不徹底? マグニチュード推定法:参考値

21 判定尺度ごとの判定値分布 スライダー(とマグニチュー ド推定法)は5段階尺度と比 べ極端な値が多い

22 提示順の影響 Eisenberg らの研究と同様の形で分散分析 「大⇒小」「小⇒大」グループ間に差が見ら れるか ↓ 「大⇒小」「小⇒大」グループ間の分析では どの尺度も統計的に有意な差 –p 値の1%水準で「提示順グループ間の平均は等 しい」という帰無仮説を棄却 – 実験2でも同様の結果

23 既往研究との比較 Eisenberg らの研究との比較 – 5段階尺度 提示順の影響 → 同様の傾向 – マグニチュード推定法(*) 提示順の影響 → 異なる傾向 Parker らの研究との比較 – 少ない文献数でも提示順の影響 → 異なる傾向

24 5段階スライダー 小⇒大大⇒小小⇒大大⇒小 文献 1 2.121.4718.212.71 文献 2 1.761.188.911.41 文献 3 2.001.2910.5912.82 文献 4 1.821.419.4717.53 文献 5 2.001.1813.4120.29 文献 6 3.242.0656.2937.82 文献 7 4.124.1887.1269.53 文献 8 4.064.0092.1868.47 文献 9 3.822.8281.7648.76 文献 10 4.243.9495.0077.35 最大値 4.244.1895.0077.35 最小値 1.761.188.9411.41 今回と Eisenberg らの研 究 ↓ 大⇒小:過小評価 同様の傾向 小⇒大:過大評価 5段階評価: 同様の傾向 スライダー:最小値では異なる傾向?

25 判定尺度と提示順:最小値頻度 最小値頻度 判定尺度 5段階スライダー マグニチュー ド 提示順提示順 大⇒小 4.83 回 2.82 回 2.94 回 小⇒大 3.53 回 3.00 回 2.44 回 混合 3.56 回 2.32 回 2.95 回 最小値頻度:ある質問の判定中に最小値が何回出現するか ≒下限への到達しやすさ

26 「大⇒小」最小値頻度の違い (イメージ図) 始終 提示順 スライダー 5段階 4.83 件 2.82 件 マグニチュード 2.94 件 大 小

27 まとめ レレバンス判定に関する判定実験を行い簡 単な分析を行った – 判定尺度間で異なる分布見られた – 提示順による違いが確認された – 5段階尺度は提示順により過大評価や過小評価、 最小値にすぐ到達するなどの傾向が見られた

28 今後の展開 実験データの整理とより高度な分析 マグニチュード推定法の判定値に関する 検討 判定時間の分析

29 提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学) agata@asia-u.ac.jp http://itasan.mydns.jp/

30

31 *インターネット上の検索システ ムあるいはブラウザによって キーワードをハイライト (黄色く色づけ) ⇒ キーワードを容易に識別 キーワードのハイライト

32 情報検索評価の枠組み レレバンス概念 レレバンス判定 検索手法の評価

33 主題的 レレバンス レレバン ス判定 検索手法の評価 利用者志向 レレバンス 質的研究 レレバンス判定そのものに関する研究は十分でない ⇒ (最近の情報環境下における)レレバンス判定について実験 具体的には判定尺度と提示順に焦点

34 発表の構成 本研究の背景 – レレバンス判定に関する研究の必要性 – 既往研究の成果 レレバンス判定実験 – 実験環境 – 実験結果 まとめ

35 判定尺度の影響 分散分析により5段階尺度、スライダー、マ グニチュード推定法(を正規化した値)の間 に差が見られるか ↓ 各尺度グループ間の分散分析で統計的に有意 な差 –p 値の1%水準で「各尺度グループ間の平均は等 しい」という帰無仮説を棄却 – 実験2でも同様の結果


Download ppt "提示順と判定基準が レレバンス判定に与える影響 安形 輝(亜細亜大学)"

Similar presentations


Ads by Google