特定保健用食品のヒト試験における統計解析方法の考え方と注意点

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
社会統計学Ic・統計科学I 第六回 ~仮説検証~
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
相関分析.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
4章までのまとめ ー 計量経済学 ー.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
統計学 西 山.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

特定保健用食品のヒト試験における統計解析方法の考え方と注意点 2013.9.19 特定保健用食品のヒト試験における統計解析方法の考え方と注意点 成蹊大学理工学部情報科学科 岩崎 学 iwasaki@st.seikei.ac.jp

Agenda Tea Tasting Lady 観測データと確率構造の例 統計的データ解析の流れと統計的な考え方 代表的な統計手法 コメント集

Tea Tasting Lady - 1 The most famous lady in the (statistical) world. 英国では,ミルクティーを作る際,ミルクを先に入れてから紅茶を注ぐものとされているようである. 昔,英国であるご婦人が「私は,ミルクを先に入れたかあるいは紅茶を先に入れたかは飲めばわかる」と発言し,その真偽を確かめるため実験を行なう事になった. どういう実験を行ない,どういう結果が出れば  このご婦人はどちらを先に入れたかの「判別力」  ありと判断できるであろうか. わが社で開発した商品はトクホとして  有効性があるだろうか(審査を通るだろうか).

Tea Tasting Lady - 2 紅茶カップを n 個(偶数)用意し,半分にはミルクを先に入れ,残りの半分には紅茶を先に入れ,それらをランダムな順序でそのご夫人に飲んでもらい,どのカップがミルクを先に入れたものであるかを判定してもらう. その結果,正解となったカップ数を m とする. ご婦人が正しく言い当てる確率を p とする. 確率は各試行で一定,かつ結果は独立であると仮定. ご婦人の判別力が全くないという仮説(帰無仮説)H0 および判別力があるという仮説(対立仮説)H1 は H0 : p = 0.5 vs. H1 : p > 0.5  となる.

Tea Tasting Lady - 3 2つの可能性 (1) n 個中,「ミルク先」がいくつあるかを知らせない.   (2) n 個中,「ミルク先」が n/2 個あることを知らせる. 正答数を X とするとき,m 個以上正解する確率 (1) では試行回数 n,確率 0.5 の二項分布 B(n, 0.5) (2) では,超幾何分布 H(m, n/2, n)

Tea Tasting Lady - 4 確率 p1もしくは p2(P値)が a = 0.05(有意水準)以下のときにご婦人の判別力ありと判断(帰無仮説 H0 : p = 0.5 を棄却) 帰無仮説が正しい(判断力がない)とすれば,このような結果が起こるはずがない 表:いくつかの n に対し,判別力ありと判断できる m の最小数,およびその時の確率(有意確率) n = 4 では,すべて正解 (m = 4) であっても判別力ありとは判断されない n = 6 では,全部正解であれば判別力ありと判断 n = 10 のときは,(1) では m = 9  m = 10 で判別力ありと判断 実際上,n は大きくできない

観測データと確率構造 N 人を被験食品群,対照食品群にそれぞれ m 人,n 人ずつランダムに割り付け,有効かどうかを調べる 仮説: P1 = P2  vs. P1  P2

この場合はどう判断 実験 A 実験 B

カイ2乗検定 検定統計量: 判断基準:Y  3.84 のとき差ありと判断 D = (ad – bc) は 2  2 行列の行列式(逆行列が存在するための条件 a : b = c : d  a/m = c/n) 判断基準:Y  3.84 のとき差ありと判断 3.84  (1.96)2 は,自由度1のカイ2乗分布の上側5%点.

結果の判断 Y = 1.67 < 3.84 被験食品と対照食品とでは有効率に差があるとは言えない Y = 8.33 > 3.84 被験食品と対照食品との間には有効率に差があると言える

統計的データ解析の流れ 研究目的の設定 データ収集法の立案:実験,観察研究,調査 データの収集(モニタリング) データの電子化 データのチェック(クリーニング),マージ データの集計とグラフ化(予備的検討):記述統計 統計的推測ないしは予測:推測統計 分析結果のプレゼンテーション:文書化,口頭発表 意思決定(終了もしくは最初に戻る)

研究目的の設定 「統計」では,研究目的の設定は,具体的に 「試験食品の有効性を立証するため」では駄目 用量設定試験:関与物質の配合量の決定 有効性検証試験:プラセボ食と被験食の比較 安全性試験:通常,3倍量の下での安全性 何をどう測るか.・・・「統計」では解答不可能な問い しかし「統計」は,技術的に,測定項目の(統計的,数学的)性質を評価できる. 食品の特長をうまく表現する.

データ収集法の立案 比較対照試験:Randomized Controlled Trial 評価項目の設定 並行群間試験 parallel comparative trial クロスオーバー試験 cross-over trial 評価項目の設定 連続型:コレステロール,血糖値,血圧 カウント型:排便回数, 2値型:(有効,無効) 摂取前値,摂取後値(1回あるいは複数回) 例数設計:有意水準(α),検出力(1-β),効果の大きさ プロトコルに詳細に記載!

統計的検定の3要素 仮説を立てる 検定統計量の選択(パラメトリック,ノンパラメトリック) 統計的有意性の評価(P値の計算と判断) 帰無仮説 (H0):差はない,偶然的変動に過ぎない 対立仮説 (H1):差がある.偶然的な変動とは言えない 片側仮説 H1 : θ > 0 両側仮説 H1 : θ ≠ 0 検定統計量の選択(パラメトリック,ノンパラメトリック) 検定に用いる値(関数) T = T(X1, . . . , Xn) を選択し, データから t* = T(x1, . . . , xn) を計算 標本平均,標本比率,t 統計量, 統計的有意性の評価(P値の計算と判断) 確率 P = Pr(T ≧ t*) を評価し(P値),P が小さいとき帰無仮説を棄却 有意水準 α:P の小ささの基準.α = 0.05 が普通. P > α のとき帰無仮説を棄却しない.帰無仮説の正しさの証明ではない

信頼区間 パラメータ θ の信頼係数 95% の信頼区間 (θL, θU) 信頼係数が高く,区間幅が短いのが理想 信頼係数を高くすると区間幅は広がり,区間幅を狭めると信頼係数が低くなる 対応策:計測を精度良く行う.サンプルサイズを増やす  95% 信頼区間がパラメータ値 θ0 を含まない   ⇔  H0 : θ = θ0 vs. H1 : θ ≠ θ0 の検定が有意水準 5% で有意

連続型データ(2群の比較) パラメトリック:2標本 t 検定 2つの正規母集団間で,分散は等しいが未知の仮定での, 平均値間の検定   2つの正規母集団間で,分散は等しいが未知の仮定での,   平均値間の検定 正規性の仮定は必ずしも厳密でなくてよい. ノンパラメトリック:ウィルコクソン検定(マン=ホィットニー検定)   2つの母集団間で,位置パラメータ(中央値など)の違いを   検定.分布型の仮定は必要ない(ノンパラメトリック検定) 共分散分析 (analysis of covariance = ANCOVA):処置前値や背景因子を共変量に取った回帰モデルに基づく検定

連続データ(多群の比較) パラメトリック:分散分析 (analysis of variance = ANOVA)   3つ以上の正規母集団で,分散が等しいという条件の下,   平均値間の差異を検定 正規性の仮定は厳密には必要ない 有意差が見られても,どこに差があるのかまでは分からない ノンパラメトリック:クラスカルのH検定   順位に基づく検定で,分布型の仮定は不要 多重比較 (multiple comparison)   想定する対立仮説ごとに種々の検定法   シェッフェ法,ダネット法,テューキー法,...

カウントデータ 有効率の比較:2つの二項分布の比較(二項確率の計算に基づく検定,正規近似による検定) 2×2分割表における検定:フィッシャー検定,独立性のピアソンカイ2乗検定(イェーツの補正を入れる・入れない) ポアソン回帰(負の二項回帰):稀な事象の生起確率に回帰モデルを想定(一般化線形モデルの枠組み) ロジスティック回帰:logit (p) = log {p/(1-p)} に回帰モデルを想定(一般化線形モデル) 参考:岩崎 学 (2010) カウントデータの統計解析.朝倉書店

コメント集-1(試験計画関連) 試験期間中の生活変動が大きかった者を除外した,とありますが,その詳細を,試験計画書における被験者の扱いの規程と共に示してください.ここでの解析はいわゆる PP (Per Protocol) 解析ですので,ITT (Intent To Treat) 解析の結果も示し,両解析間の相違を考察すると共に,試験計画書でどの解析を主要な解析とするように規定していたのかも含めて説明してください. 資料1には臨床試験の計画ならびに実施に関する詳細が記載されていません.資料に記載されている事柄を確認するためにも,試験計画および試験結果のデータを提出されたい.

コメント集-2(統計解析の詳細) 実験結果は図示されていますが,せっかくデータ解析をしているのですから,図で示すだけでなく統計数字で示される部分は示していただきたい.回答文には,「直線の傾きも変化しました」とか「直線の傾きの変化が確認されました」といった記述がありますが,これらに対する数値的な裏付け,たとえば検定結果とか,求めたパラメータ値の標準誤差の表示などがあってしかるべきであると思います. 論文には,統計的な検定結果が p < 0.05 あるいは n. s. のような形で記載されています.しかし,具体的にどういう検定を行なったのかの記載がありません.検定法についての詳細を示してください.

コメント集-3(統計解析の詳細) 統計的有意差が見られているパラメータも散見されますが,効果はそれほど大きくないという印象です.多重性の調整を行なうと結果はどうなるのでしょう. 試験はクロスオーバー法によって行なわれていて,△△△に関しては試験飲料群において統計的有意性が認められている点はそれなりに評価できますが,クロスオーバーによる試験結果の詳細が不明です.確認のため,キャリーオーバーや時期効果の有無など,統計解析の詳細が知りたいと考えます.

コメント集-4(効果の評価) 結論から言えば,試験結果は必ずしもクリアカットなものとは言い難い.12週の試験において4週と8週でのみ統計的有意差もしくは有意傾向があったというのでは,何のための12週の試験であったのかと言いたくなります.また,有意差の見られた測定項目における効果の大きさが臨床上意味のある効果であるかどうかについては判断の根拠を持ち合わせないので,専門の先生方のご判断に委ねます. 実施された実験では,当該食品を摂取した結果,摂取前と比較して○○○が統計的に有意に下降したとのことでした.しかしこの実験ではプラセボ群が設定されていないため,プラセボ効果がどの程度であったのかが判然とせず,したがって当該食品の効果の有無および程度が評価できません.

コメント集-5(同等性) 統計の立場からは「統計的有意差がなければ同等」という[消極的な]ロジックは通常受け入れられなくて,「非劣性試験」としては,合理的な非劣性限界を設定した上で,それを下回らないことを示すという[積極的な]試験結果をもって同等(非劣性)と判断します. 相応の被験者数を用意した上で,点推定値として既存値を上回っていれば問題はないと思いますが,点推定値で既存値を下回った場合には上述のような何らかの理由付けが必要となります(でないと徐々に値が下がる危険性があります). 「同等」と判断した根拠となる論文を見せていただければ,その結果の妥当性が評価できます.

コメント集-6(再試験) 本来であれば,文献調査や動物実験,そしてヒトを対象とした試験による用量設定を経て,プラセボ対照の比較試験を実施するのが筋であることは疑いありません.本申請は,用量設定があいまいなまま比較試験を実施していたわけで,今回追加的に用量設定試験を行っています. 摂取試験結果を見るに,△△の推移に関して試験食が対照食に比べその上昇を有意に抑制しているという客観的な証拠は得られていないと考えます.むしろAUCにおいては対照食のほうがわずかであるが小さいように見受けられます.部分集団解析では若干の統計的有意性及び有意傾向を観察していますが,証拠不足の感は否めません.対照食を適切に選択し,統計的有意性を示すことが期待されるだけの被験者数及び試験手順をもって再度試験をする必要があると考えます.