確率モデルを用いた 情報通信技術入門 ー誤り訂正符号を中心にー

Slides:



Advertisements
Similar presentations
効率的に計算可能な 加法的誤りの訂正可能性 安永 憲司 九州先端科学技術研究所 SITA 2012 @ 別府湾ロイヤルホテル
Advertisements

区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
ソーラス符号の パーシャルアニーリング 三好 誠司 上江洌 達也 岡田 真人 神戸高専 奈良女子大 東大,理研
自己重力多体系の 1次元シミュレーション 物理学科4年 宇宙物理学研究室  丸山典宏.
菊池自由エネルギーに対する CCCPアルゴリズムの拡張
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
[復習]通信路符号化の限界 通信路符号化定理(Shannonの第2符号化定理)
AllReduce アルゴリズムによる QR 分解の精度について
Reed-Solomon 符号と擬似ランダム性
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
2012年度 情報数理 ~ QRコードを作ろう!(1) ~.
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月12日前半
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
10.通信路符号化手法2 (誤り検出と誤り訂正符号)
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
Statistical Physics and Singularity Theory
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
決定木とランダムフォレスト 和田 俊和.
背 景 多数の「スピン」とそれらの「相互作用」という二種類の変数を有する系の解析においては,相互作用の方は固定されておりスピンだけが 変化するモデルを考える場合が多い.   (例:連想記憶モデル) 「スピン」よりもゆっくりと「相互作用」も変化するモデル(パーシャルアニーリング)の性質は興味深い.
はじめに: 平均場理論を用いた情報処理の最近の動向
領域ベースの隠れ変数を用いた画像領域分割
センサーネットワークでも 「More is different」
NTTコミュニケーション科学基礎研究所 村山 立人
教師なしデータ 学習データ  X1, X2, …, Xn   真の情報源 テストデータ  X  .
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
第14章 モデルの結合 修士2年 山川佳洋.
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日後半
予測に用いる数学 2004/05/07 ide.
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
統計解析 第1回 条件付き独立性と確率的グラフィカルモデル 本講義の全体像
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
ガウシアン確率伝搬法の 近似精度に対する理論解析
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
ナップサック問題 クマさん人形をめぐる熱いドラマの結末.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
若手研究者・学生向けに,最新技術をわかりやすく紹介する講演会 確率的情報処理としての移動体通信技術
サポートベクターマシン Support Vector Machine SVM
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
確率の生み出す新しい情報処理技術 東北大学 大学院情報科学研究科 田中 和之
富山大学 公開講座 2008 「QRコードを作ろう!」 ~ ハミング距離 ~.
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
京大院情報学研究科 Graduate School of Informatics, Kyoto University
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
Max Cut and the Smallest Eigenvalue 論文紹介
人工知能特論II 第8回 二宮 崇.
エラー訂正符号を含むシステム CD, DAT, MD, DVD, ディジタルVTR等 ディジタル(衛星)TV放送 ディジタル・セルラ
ポッツスピン型隠れ変数による画像領域分割
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
分枝カット法に基づいた線形符号の復号法に関する一考察
領域ベースの隠れ変数を用いた決定論的画像領域分割
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
線形符号(10章).
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
ガウシアングラフィカルモデルにおける一般化された確率伝搬法
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
2008年度 情報数理 ~ 授業紹介 ~.
2012年度 情報数理 ~ 授業紹介 ~.
2012年度 情報数理 ~ ハミング距離 ~.
Presentation transcript:

確率モデルを用いた 情報通信技術入門 ー誤り訂正符号を中心にー 東京工業大学大学院 知能システム科学専攻 樺島祥介

概要 誤り訂正符号とは 低密度パリティ検査符号 レプリカ法による性能評価 平均場近似による復号

誤り訂正符号とは 情報通信において、冗長な情報表現により送信誤りを訂正する符号化技術 原情報 0010 0010101 0010101 復号 0010 0010101 符号化 誤り訂正 0010101 0110101 符号語 送信

パリティ検査(I) 例)(7,4)ハミング符号の仕組み 原情報:x=(x0 x1 x2 x3) x5 パリティビット:x4=x0+x2+x3 符号語:y=(x0 x1 x2 x3 x4 x5 x6) 符号の構成規則

パリティ検査(II) 1ビット誤り訂正可能 パリティ検査 z1=1 z0=x0+x2+x3+x4 z1=x0+x1+x3+x5 z0=x0+x2+x3+x4 z1=x0+x1+x3+x5 z2=x0+x1+x2+x6 z2=1 1 1 1 1 誤りなし  → (z0 z1 z2)=(0 0 0) 誤り検出 ← (z0 z1 z2)=(0 0 0) z0=0 (z0 z1 z2)=(0 0 1)~(1 1 1)の7通りが 7通りの1ビット誤りに対応 1ビット誤り訂正可能

線形写像と符号化/復号 H GT #重要な性質 HGT=0 符号化は線形写像 復号は線形方程式  復号は線形方程式 y= 1000 x=GTx 0100 0010 0001 1011 1101 1110 z= 1011100 (y+n)=H(y+n) 1101010 =H n 1110001 H ノイズを取り出す #重要な性質 GT HGT=0

低密度パリティ検査符号(I) 現時点での最良 符号の一つ! (7,4)ハミング符号を一般化 N ビットの符号語を K ビットから作る ただし、パリティ検査行列 H をランダムに生成 k 現時点での最良 符号の一つ! H= 0 1 0 0 0 … 0 0 1 0 0 0 0 1 … 1 0 0 1 0 1 0 0 … 0 0 0 …………………… 0 0 0 1 0 … 0 1 0 j N-K N

低密度パリティ検査符号(II) K×N 生成行列 GT s.t. HGT=0 符号化: y=GTx 送信(誤り発生): y+n=GTx+n パリティ検査: z=H(y+n)=H(GTx+n)=Hn 復号(I): z=Hn  → n どう解くか? 復号(II): y=GTx → x

復号問題とベイズ統計 ノイズ n は確率的 ベイズ統計 P(n|z) = P(z|n)P(n) = δ(z=Hn)P(n) ノイズビット毎の最適推定 P(z) Σδ(z=Hn)P(n) 1, if <ni> > 1/2 0, otherwise ni= <ni>=Σni P(n|z):事後分布での期待値

性能評価問題 [Pe]H =(1/N)Σ[δ(ni=ni)]n,H 性能評価指標 自然な疑問: ノイズ推定の平均ビット誤り率 低密度パリティ検査符号はどの程度の誤り訂正能力を備えるか? 符号の能力はパラメータ(k,j)にどのように依存するか? #とりあえず計算コストは考えないことにする 性能評価指標 ノイズ推定の平均ビット誤り率 [Pe]H =(1/N)Σ[δ(ni=ni)]n,H

伝統的符号理論の接近法 大自由度性(通常、N,Kは数千~)、離散性のため直接評価困難 評価の容易な間接的指標(確率の上界、最小符号語間距離等)に帰着 厳密ではあるが、あくまでも上界評価 痒いところに手が届かない 議論の展開が難解

統計力学による接近法 磁石の模型との類似性、大自由度性を利用した直接的評価 痒いところに手が届く 議論の展開が素直 厳密性はこれからの課題

ゲージ変換 = (1/N) Σ∫dx [δ(x-<ni>)]n,H [Pe]H =(1/N)Σ[δ(ni=1)]n,H シンドロームは常にz=0 推定値niの0,1が誤りのインジケータ [Pe]H =(1/N)Σ[δ(ni=1)]n,H = (1/N) Σ∫dx [δ(x-<ni>)]n,H 1/2

レプリカ法 [δ(x-<ni>)]n,H =∫dke-ikxΣ(xp/p!) [<ni>p]n,H 「2重平均」を系統的に評価する方法 予稿参照 平均場モデル 要素間の入れ換え対称性+大自由度性 レプリカトリックは平均場モデルなら容易に実行可能 [δ(x-<ni>)]n,H =∫dke-ikxΣ(xp/p!) [<ni>p]n,H 物理学独特の接近法

平均場モデルとしての低密度パリティ検査符号 H= 0 1 0 0 0 … 0 0 1 0 0 0 0 1 … 1 0 0 1 0 1 0 0 … 0 0 0 …………………… 0 0 0 1 0 … 0 1 0 k j N-K N 入れ換え対称性 個々のHにはない 平均的にはある 大自由度性 N,K :103~ 巨視的変数による記述 N:大 大数の法則 N:小 m=(1/N)Σmi

性能評価の例 N=104, k=4, j=3 マーカーはノイズの真値と復号結果との重なりrを50回の実験に関し平均したもの.横軸はノイズの大きさp.曲線は統計力学による理論値.

復号のコスト 復号に必要な期待値<ni>=Σni P(n|z)の計算はNP困難 なのになぜ復号できてるの? 統計力学の知見に基づく近似アルゴリズム

<ni>=Σni P(n|z) 統計的情報処理の計算コスト ベイズ統計による情報処理 見通し良い.性能良い. 計算量的に実現困難. 例)誤り訂正符号の復号 <ni>=Σni P(n|z) 2N回の和が必要 #ギブス学習、ベイズ学習、CDMAマルチユーザー復調等も同様

グラフ構造と計算可能性(I) ただし、相互作用が特殊なグラフで表現される分布では爆発が生じない 結合無し(自明な例)  結合無し(自明な例) #計算コストは1自由度当たりO(1)

グラフ構造と計算可能性(II) 1次元鎖  以下の量を定義

転送行列法 パスは一つ 漸化式 端から端でO(N) 平均 #計算コストは1自由度当たりO(1)

グラフ構造と計算可能性(III) 木 転送行列法は木にも  一般化可能  ビリーフプロパゲーション

一般の分布で困難な理由 一般のグラフは分割不可能 結合があるため各々 独立に和を取れない

平均場近似 計算困難な分布を計算が容易な分布で近似する 似させる 計算が容易な分布 本物の分布

ナイーブ平均場近似 KLダイバージェンスを最小化するように    を決める 計算が容易な分布の空間

ベーテ(Bethe)近似 局所的に木構造を仮定して近似 低密度パリティ検査符号の復号アルゴリズム Loopy Belief Propagation等とも呼ばれる どんな理屈から導出されるのか?

木構造とKLダイバージェンス(I) 補題:Junction Tree Algorithm :Reducibility ループがなければ結合確率を高速に以下の表現に書き直すことが可能 Junction Tree :Reducibility

木構造とKLダイバージェンス(II) 試験関数を以下のように仮定 KLダイバージェンス ただし

木構造とKLダイバージェンス(III) KLダイバージェンスを最小化 Reducibility が存在 ⇒Lagrange未定乗数 答えはJTAの解(当たり前) Reducibility が存在 ⇒Lagrange未定乗数

Lagrange未定乗数の決定 未定乗数は以下の方程式から決まる 反復法で解ける 反復アルゴリズムは局所的な情報にしか依存していない!

非木構造への拡張 一般のグラフに対しても以下のコスト関数 未定乗数の反復アルゴリズム 木構造ならKLD 最小化に一致

低密度パリティ検査符号とベーテ近似 ベーテ近似の復号ななぜうまくいく? 低密度パリティ検査符号はランダムグラフ ベーテ近似の復号ななぜうまくいく?  低密度パリティ検査符号はランダムグラフ ループは存在 ただし、ループの長さはO(ln N) 程度 N→∞でループの影響は無視できる 木構造による近似の妥当性

まとめ 大規模統計モデルに基づく情報処理 物理学における常套手段 この接近法はおそらく情報科学でも有効 性能評価問題 アルゴリズム開発 解析解の求まる(平均場)モデルを構成 解析解を起点に摂動で接近 この接近法はおそらく情報科学でも有効

参考文献 岩波講座 物理の世界 学習と情報の平均場理論 樺島祥介著(定価1300円) 岩波講座 統計科学のフロンティア (現在執筆中) 岩波講座 物理の世界 学習と情報の平均場理論 樺島祥介著(定価1300円) 岩波講座  統計科学のフロンティア (現在執筆中) 樺島祥介,上田修功共著