感受性遺伝子解析の データ処理 平成18年11月29日 山田.

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
配偶者選択による グッピー (Poecilia reticulata) の カラーパターンの進化 :野外集団を用いた研究 生物多様性進化分野 A1BM3035 吉田 卓司.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
確率・統計Ⅱ 第7回.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
統計学 12/13(木).
計算値が表の値より小さいので「異なるとは言えない」。
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
対立仮説下でのみ存在する 遺伝形式という母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
日本人類遺伝学会 2014/11/20 京都大学 医学研究科 統計遺伝学分野 山田 亮
第3章 統計的推定 (その1) 統計学 2006年度.
食中毒と疫学調査の統計 ~2×2表~ 岡山理科大学 山本英二 2002/02/20.
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
統計学 西 山.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
法数学勉強会 2016/06/15 京都大学(医)統計遺伝学分野 山田 亮
遺伝統計学 集中講義 (4) SNPによる領域の評価
母分散の信頼区間 F分布 母分散の比の信頼区間
母分散の検定 母分散の比の検定 カイ2乗分布の応用
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
統計的検定   1.検定の考え方 2.母集団平均の検定.
川口 喬久 川上 弘人 山田 亮 関根 章博 中村 祐輔 山本 一彦 角田 達彦 理化学研究所 遺伝子多型研究センター
尤度の比較と仮説検定とを比較する ~P値のことなど~
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
森美賀子 山田亮 小林香子 川井田礼美 山本一彦
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
親子鑑定に見る尤度比を 角度を変えて眺めてみる
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
遺伝統計学 集中講義 (2) 連鎖不平衡・連鎖不平衡マッピング
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
Presentation transcript:

感受性遺伝子解析の データ処理 平成18年11月29日 山田

遺伝子と疾患との関係 どんな関係を調べたいのか

遺伝子と疾患との関係 どんな関係を調べたいのか? 対象は何か? 関係の性質は 遺伝子の何との関係が調べたいのか? 疾患の何との関係が調べたいのか? 関係の性質は 因果関係か? 相関関係か?

関係を調べる基本は・・・ 遺伝子側1要素 対 疾患側1要素 認められる関係は 相関関係 因果関係は介入実験・経時観測実験で

遺伝子の何との関係

遺伝子の何との関係 遺伝子産物の機能 遺伝子の発現量 遺伝子配列の個人差

疾患の何との関係

疾患の何との関係 疾患の病理 疾患の発病 罹患後の疾患活動性 疾患の予後 治療反応性

遺伝子の何 対 疾患の何 疾患の病理 疾患の発病 疾患活動性 疾患の予後 治療反応性 遺伝子産物の機能 遺伝子の発現量 遺伝子の個人差

調べる対象は 遺伝子側要素 対 疾患側要素 1 対 1 複数 対 1 1 対 複数 複数 対 複数 それらの組合せ

調べたいこと

調べたいこと 『ある遺伝子Gは疾患Xの発病促進リスク遺伝子であるかどうか』

調べたいこと 『ある遺伝子Gは疾患Xの発病促進リスク遺伝子であるかどうか』 これでデータの収集(実験)が開始できるでしょうか?

調べたいこと 『ある遺伝子Gは疾患Xの発病促進リスク遺伝子であるかどうか』 『ある遺伝子G』に個人差がないと先に進めない と分解すれば先に進めます

調べたいこと 『ある遺伝子Gは疾患Xの発病促進リスク遺伝子であるかどうか』 『ある遺伝子G』に個人差がないと先に進めない と分解すれば先に進めます

『ある遺伝子Gに個人差があって』 変異・多型 変異と多型の組合せ 同一種の塩基配列はところどころ違う、それが変異・多型 アレル(アリル) Diploidとしての組合せ:ジェノタイプ Haploidとしての組合せ:ハプロタイプ 両方の組合せ:ハプロタイプが作る複合ジェノタイプ

『その個人差と疾患Xの発病とが関係するかどうか』 『その個人差』 アレル SNPなら2種類 x 多型の数 ジェノタイプ SNPなら3種類 x 多型の数 ハプロタイプ SNPなら 2^多型の数 『疾患Xの発病』 ケースかコントロールか

『遺伝子G1とG2と・・・と 疾患Xの臨床マーカーM1とM2と・・・とが関係するかどうか』 疾患P1 遺伝子G1 疾患P2 遺伝子G2 遺伝子G3 疾患P3 遺伝子G5 遺伝子4 疾患P4 遺伝子G6 疾患P5

複数の関係について考えなくてはならないが・・・ まずは1つの『関係』について考える 『関連解析』という手法 分割表検定から2つのことをする 『関連があるか、ないか』 帰無仮説『関連がない』とその棄却検定 →P値 『関連を数値で表すといくつか』 『関連がある』として、それを数字で表すといくつか →オッズ比

検定をする前に データのチェック アッセイの成功率 極論すれば、成功率が悪くても、「ランダム」な失敗であれば大丈夫 成功率に偏りがないか ただし、普通は成功率が悪ければ、サンプリングバイアスに加えたバイアスが混入しているものとして立ち止まる 成功率に偏りがないか ケースばかりの失敗、コントロールばかりの失敗 ・・・それに万一、疾患関連遺伝因子が絡んでいないか? たくさんの遺伝マーカーのデータがあれば、それらを総合して判断することも可能→細かい話しになるので省略

検定をする前に データのチェック サンプリングバイアスの有無の情報が得られないか? 『ランダムメイティングの仮定できる、均一集団からのランダムサンプル』であると、余計なことを考えなくてよいので、それに関する情報をとる Hardy-Weinberg平衡検定 疾患と無関係な因子についてはケースコントロール両群でHWEが成立する 疾患と関係する因子については、有病率が高くない疾患では、ケース群については必ずしもHWEが成立しない ランダムメイティングが仮定できない集団の場合にはHWEが成立しないこともあり、その場合には、この方法は使えない たくさんの遺伝因子についての情報があれば、それらを全部総合してランダムメイティング均一集団であるかの情報を得ることができる・・・少し細かい話しになるので、省略(ウェブテキストなど参照)

分割表検定 遺伝因子あり 遺伝因子なし 計 ケース集団 A B E コントロール集団 C D F G H N

HWE検定2法 カイ自乗検定 正確確率検定 HWEの場合は2つの検定のP値は大きく異なる。カイ自乗検定の方が保守的(P値が低く出やすい)。

カイ自乗検定・Fisherの正確確率検定 遺伝因子あり 遺伝因子なし 計 ケース標本 A B E コントロール標本 C D F G H N カイ自乗検定・Fisherの正確確率検定 『もしもケース標本とコントロール標本とが、同じ集団からの標本』で、集団の分布のとおりにサンプリングされたとすると、AD/BC=1 観測されたAD/BCが1からはずれているとして、ランダムに標本を採ってきたときに、そのはずれの程度が観測値の場合よりもずれる確率はいくつかを求める。 カイ自乗値の計算は簡単(だから、使用制限がある) Fisherの正確確率検定は面倒(だけど、最近の計算機環境では痛痒なし)

オッズ比と棄却検定 『もしもケース標本とコントロール標本とが、同じ集団からの標本』で、集団の分布のとおりにサンプリングされたとすると、AD/BC=1 オッズ比はAD/BCである。 オッズ比は遺伝因子が疾患の有無への影響力の代表値である 『影響力』は『相対危険度』とみなせることが多く、『相対危険度』分割表から推定される。 『相対危険度の推定値』はオッズ比と中心に、ある信頼区間を持った範囲に分布すると考える。 『相対危険度の推定値』の信頼区間の下限が1を上回るとき、帰無仮説(相対危険度が1であるとする仮説)は、その信頼区間に対応する棄却水準で棄却されたということと、ほとんど同じである(使用する検定その他により少しずれが出る)

カイ自乗検定の使用制約 カイ自乗値の計算は簡単(だから、使用制限がある) Fisherの正確確率検定は面倒(だけど、最近の計算機環境では痛痒なし) Fisherの正確確率検定は『正確』なP値を返す カイ自乗検定は、Fisherの正確確率検定P値の近似値を与える。 カイ自乗検定のP値は、分割表のセルの数値が小さくなってくると、Fisherのそれとのずれが大きくなる。 次の基準は1950年代から言われている基準である・・・(Cochran, W. G.: Some methods for strengthening the common χ2 tests. Biometrics, 10, 417-451, 1954) 期待値が 1 未満のセルが 1 つでもある。 期待値が 5 未満のセルが全体のセルの数の 20 % 以上ある

分割表の作り方 分割表ができたら、帰無仮説棄却検定とオッズ比による因子の強さについての情報が取れることがわかった SNPのタイピングはジェノタイプ(3種類) ケース・コントロール関連解析では2x3分割表ができる 11 12 22 計 ケース A B C G コントロール D E F H I J K N

2x3分割表そのものについて関連(独立性)検定 アレル本数2x2分割表 11 12 22 計 ケース A B C G コントロール D E F H I J K N 2x3分割表そのものについて関連(独立性)検定 アレル本数2x2分割表 染色体本数についてアレルの数を数える 総標本数は2xN ジェノタイプをプールして2x2分割表 11+12 対 22 11     対 12+22 11+22 対 12 ・・・はやってもよいけど、何を調べたいかの仮説が立てにくいのでやらないことが多い

1つのSNPで複数の検定 4つの分割表ができた 複数の分割表のそれぞれからP値を算出すると、そのP値の意味を再解釈する必要が必ず出る ひとつの実験データから、いくつもの分割表で検定すればするほど、『うまいこと』統計的に有意な結果を得られそうだが、必ずしもそうとはいえない。その『うまいこと』行かないように『平等』に、『ずる』がないようにするのが『Multiple testing補正』

アレル別検定 N人の標本=2xN本の染色体の標本 ケース群・コントロール群とでアレルの比率が同じか違うかを検定する 2x2分割表検定 標本数が多い(ジェノタイプ別の2倍)ので、検出力が大きい オッズ比は2群のアレル頻度の違いの強さの指標であり、個人の発症しやすさ(相対危険度)としての意味づけはない→集団としての特性を示す もし1SNPあたり1検定だけを選ぶなら、これ

ジェノタイプ2X3分割表検定 3ジェノタイプの分布の具合がケースコントロール間で同一かどうかを検定する 2x3分割表検定 11、12、22の3ジェノタイプにリスク上の序列をつけたいときには、それなりの手法があるが、一般的にはそれを実施する必要はない オッズ比を求めるのであれば、基準となるジェノタイプを設定し、それに対するオッズ比をジェノタイプ別に求める

ジェノタイプ2X2分割表検定 リスクアレルを1本以上もっている場合と1本も持っていない場合(優性遺伝形式に似る) リスクアレルを2本もつ場合と1本以下の場合(劣性遺伝形式に似る) 2x2分割表検定 オッズ比はそれぞれの設定されたジェノタイプグループにおける相対危険度の近似値を与える

複数SNPの組合せ(ハプロタイプ) 物理的に並んでいるSNP ハプロタイプを推定する ケース・コントロール集団ごとにハプロタイプ頻度の推定値が計算される ハプロタイプアレルによる2xNサンプルの検定となる それをもとに2xN分割表ができる 2xN分割表検定を行う場合と N通りの2x2分割表を作成してそれぞれについて検定する場合がある ここまでは、比較的ルーチンに行われる いくつかのハプロタイプをプールしたり、ハプロタイプが作る推定ジェノタイプを用いたりする検定は特別な事情のある場合に実施することがある

複数SNPの組合せ(機能組合せ) 物理的に並んでいないSNP ハプロタイプは存在しない 複数のSNPが作る複合ジェノタイプ N SNPで3^Nジェノタイプ これらの分布がケース・コントロール間で均一かどうかを検定する 2x3^N 分割表検定 それを個別にくくったりすることはよほどの理由がなければ行わない

Multiple testing P値とは 分割表の観測値からP値が算出されたとする もし関連がない母集団からたくさんのサンプリングを繰り返すと・・・ P<=0.01が得られる確率は0.01 P<=0.05が得られる確率は0.05 P<=0.5が得られる確率は0.5 P<=0.05が得られる確率と0.05<P<=0.1が得られる確率は等しくて、0.05

1に近いp値も0に近いp値も同じ頻度で現れる 帰無仮説がなりたつとき P値で度数分布をとると・・・ p 1 比率 1に近いp値も0に近いp値も同じ頻度で現れる

1マーカーでの関連解析 形質(疾患) マーカー 形質とマーカーとに強い関連がある

1マーカーでの関連解析 形質(疾患) マーカー 形質とマーカーとに強い関連がある

多マーカーでの関連解析 形質(疾患) マーカー2つ

多マーカーでの関連解析 形質(疾患) マーカー 形質と第1マーカーとに強い関連がある?

多マーカーでの関連解析 形質(疾患) マーカー 形質と第1マーカーとに強い関連がある ???????

多マーカーでの関連解析

多マーカーでの関連解析 ←同じ→

多マーカーでの関連解析

多マーカーでの関連解析

多マーカーでの関連解析 どのマーカーとは言わないが マーカーと形質には関係がある マーカー同士は独立でない 相互に近いマーカーでは個人のジェノタイプが似ている →連鎖不平衡にある マーカー同士は 独立である

多マーカーでの関連解析 ←同じ→

多マーカーでの関連解析

多マーカーでの関連解析

多マーカーでの関連解析 個人のジェノタイプが似ているのではなく、集団のジェノタイプが似ている どのマーカーとは言わないが マーカーと形質には関係がある マーカー同士は独立でない 個人のジェノタイプが似ているのではなく、集団のジェノタイプが似ている →集団の遺伝的バックグラウンドが異なる マーカー同士は独立でない 相互に近いマーカーでは個人のジェノタイプが似ている →連鎖不平衡にある

実際には、ケースとコントロールとがそれぞれへテロな集団の混合で、その混合比が異なり、また、異集団間の差も大きくないので・・・ 集団構造化の影響 実際には、ケースとコントロールとがそれぞれへテロな集団の混合で、その混合比が異なり、また、異集団間の差も大きくないので・・・

複数の仮説が独立であること、そうでないこと 2つの仮説が独立であるとき それぞれの仮説から得られるP値の間に相関がない 2つの仮説が独立でないとき それぞれの仮説から得られるP値の間に相関がある 片方が「たまたま」低いP値をとるようなとき、なんらかの理由があって、もう片方も低いP値をとる

互いに独立でない仮説 あるSNPについて作成した4個の分割表検定は互いに独立ではない あるSNPとそのSNPを含むハプロタイプとでは、それぞれに行う関連検定は互いに独立ではない 相互に遠位にあるSNP同士でも、集団の構造化などが原因で関係が生じることがあるが、そのようなとき、そのSNPにおける関連検定同士は独立ではない 疾患とそのバイオマーカーとに対して行う関連検定は互いに独立ではない 。。。。

2つの独立な仮説でのP値 B A D C どちらかの仮説でP<=0.05となる確率はB+C+D=0.0975~0.1 = 0.95 x 0.95 = 1-0.0975 = 0.9025 B A 仮説2 どちらかの仮説でP<=0.05となる確率はB+C+D=0.0975~0.1 0.05 D C 0.05 -D=0.0475 0.05x0.05=0.0025 0.05 仮説1

K個の独立な仮説検定をして 個々の仮説の棄却水準a(たとえばa=0.05) K個の仮説のすべてが棄却されない確率は これは得られたP値をK倍してやればいいことを示している このようにP値を補正するのをBonferroniの補正と言って、もっとも保守的な補正である K=20でa=0.05だと、この値は1 1個の仮説はP<=0.05をとる確率が1(=あたりまえ)

2つの独立な仮説でのP値 B A D C どちらかの仮説でP<=0.05となる確率はB+C+D=0.0975~0.1 = 0.95 x 0.95 = 1-0.0975 = 0.9025 B A 仮説2 どちらかの仮説でP<=0.05となる確率はB+C+D=0.0975~0.1 0.05 D C 0.05 -D=0.0475 0.05x0.05=0.0025 0.05 仮説1

B+D=0.05であれば、正方形のどこに置いても問題ないから、移動する 2個の仮説が独立ならば、A,B,C,Dの面積は変わらない 仮説同士が独立でないと・・・ B+D=0.05であれば、正方形のどこに置いても問題ないから、移動する 2個の仮説が独立ならば、A,B,C,Dの面積は変わらない 1-B-C-D = 0.95 x 0.95 = 1-0.0975 = 0.9025 A B 0.05 仮説2 D C 0.05 -D=0.0475 0.05 仮説1

B+D=0.05であれば、正方形のどこに置いても問題ないから、移動する 2個の仮説が独立ならば、A,B,C,Dの面積は変わらない 0.05 仮説2 D C C=0.05 -D 0.05 仮説1

仮説同士が独立でないと・・・ B+D=C+D=0.05で変わらないが、Dの占める割合がだんだん大きくなり、BとCが小さくなる。 したがって、B+C+Dは小さくなりAが大きくなる。 A=1-B-C-D 2個の仮説が完全に同じだとB=C=0、D=0.05、A=0.95 ~1個の仮説の検定と同じ A B 仮説2 0.05 D C C=0.05 -D 0.05 仮説1

相互に独立でない仮説の場合 Bonferroniの補正をして有意であれば、絶対に有意であるが、保守的すぎて、有意な結果が出るとは思えない 別の方法がいる パーミュテーションテストという方法 どのくらい割り引いていいかわからないので、ケースとコントロールのわりつけをいろいろ代えてみて、観測データがどれくらい珍しい値かを値踏みする方法

多数のマーカーのデータの場合 多数のマーカーの場合には、多数のものが独立に振舞うべきであるという前提から、いくつかの情報をとることができる ケース群とコントロール群とが、ランダムメイティング集団か階層化しているかの判定(階層化検定) ケース群とコントロール群とが、ランダムメイティングしていても、若干の遺伝的背景差がある場合、および、ランダムメイティングしていなくても、均等な階層化であれば、検定上の大きな問題は出ないが、階層化の仕方に若干の差がある場合 その情報を組み込む工夫をする(Genomic controlなど)

性染色体の事情 X染色体は女2本、男1本という事情がある X染色体にはPseudoautosomal regionといわれる領域があり、その領域はY染色体に相同領域があり、男も2アレル持つ Pseudoautosomal regionは常染色体と同様の扱い、それ以外のX染色体領域は、アレル本数の計算、ジェノタイプの扱いについて男女別に行う必要がある