5.情報源符号化(5章).

Slides:



Advertisements
Similar presentations
北海道大学 Hokkaido University 1 情報理論 講義資料 2016/06/22 情報エレクトロニクス学科共通科目・2年次・第 1 学期〔必修 科目〕 講義「情報理論」第 5 回 第 3 章 情報源のモデル [ 後半 ] 3.5 情報源のエントロピー.
Advertisements

効率的に計算可能な 加法的誤りの訂正可能性 安永 憲司 九州先端科学技術研究所 SITA 2012 @ 別府湾ロイヤルホテル
1 線形代数学. 2 履修にあたって 電子情報システム学科 必修 2005 年度1セメスタ開講 担当 草苅良至 (電子情報システム学科) 教官室: G I 511 内線: 2095 質問等は上記のいずれかに行なうこと。 注意計算用のノートを準備すること。
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
0章 数学基礎.
Probabilistic Method 7.7
第四章 情報源符号化の基礎 4・1 情報量とエントロピー 4・2 エントロピー符号化 4・3 音声符号化 4・4 画像符号化.
LZ符号化 森田 岳史.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
情報エレクトロニクス学科共通科目・2年次・第1学期〔必修科目〕 講義「情報理論」(クラスC)
4-3:高度なソートアルゴリズム① (分割統治法にもとづくソート)
5.チューリングマシンと計算.
5.チューリングマシンと計算.
Reed-Solomon 符号と擬似ランダム性
論理式の表現を数学的に取り扱いやすくするために代数学の助けを借りる.
データ構造と アルゴリズム 第二回 知能情報学部 新田直也.
9.NP完全問題とNP困難問題.
Probabilistic Method 6-3,4
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
10.通信路符号化手法2 (誤り検出と誤り訂正符号)
情報エレクトロニクス学科共通科目・2年次・第1学期〔必修科目〕 講義「情報理論」
5.5 The Linear Arboricity of Graphs (グラフの線形樹化数)
7.時間限定チューリングマシンと   クラスP.
7-3.高度な木 (平衡木) AVL木 平衡2分木。回転操作に基づくバランス回復機構により平衡を保つ。 B木
第3回: 今日の目標 平均情報量を説明し、計算できる シャノンの通信モデルを説明できる 情報源符号化の条件を示せる
3. 可制御性・可観測性.
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当: 亀田 弘之
決定木とランダムフォレスト 和田 俊和.
7.4 Two General Settings D3 杉原堅也.
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
Basic Tools B4  八田 直樹.
複数の相関のある情報源に対するベイズ符号化について
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当: 亀田 弘之
Extractor D3 川原 純.
25. Randomized Algorithms
計算量理論輪講 chap5-3 M1 高井唯史.
様々な情報源(4章).
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
決定木-II 学習目標 1.○与えられた事例集合から,指定された属性選択基準に基づいて決定木を生成 できる 利得 利得比
Hoffman符号 2011/05/23.
2007年度 情報数理学.
4. システムの安定性.
アルゴリズムとデータ構造 第3章 ヒープ 5月31日分
第16章 動的計画法 アルゴリズムイントロダクション.
計算の理論 I 反復補題 月曜3校時 大月 美佳 平成15年7月14日 佐賀大学知能情報システム学科.
富山大学 公開講座 2008 「QRコードを作ろう!」 ~ ハミング距離 ~.
計算の理論 I -数学的概念と記法- 火曜 12:50~14:20 大月 美佳 2004年4月20日.
構造的類似性を持つ半構造化文書における頻度分析
5.チューリングマシンと計算.
解析学 ー第9〜10回ー 2019/5/12.
プログラミング言語論 第10回 情報工学科 篠埜 功.
計算の理論 I -数学的概念と記法- 月曜3校時 大月 美佳.
7.8 Kim-Vu Polynomial Concentration
矛盾した知識 デフォルト推論 仮説を用いた推論 準無矛盾推論 デフォルト規則 デフォルト理論の拡張 → デフォルト証明 シナリオ
電気回路学Ⅱ 通信工学コース 5セメ 山田 博仁.
分枝カット法に基づいた線形符号の復号法に関する一考察
4.プッシュダウンオートマトンと 文脈自由文法の等価性
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
計算の理論 I 反復補題 火曜3校時 大月 美佳 平成16年7月13日 佐賀大学知能情報システム学科.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
コンパイラ 2012年10月11日
参考:大きい要素の処理.
情報数理Ⅱ 第10章 オートマトン 平成28年12月21日.
線形符号(10章).
2012年度 情報数理 ~ ハミング距離 ~.
2010年度 情報数理 ~ ハミング距離 ~.
Presentation transcript:

5.情報源符号化(5章)

情報源符号化の役割 伝送路 (通信路) 情報 情報源 符号化 復号化 受信者 今回扱う。 ☆雑音のない理想的な場合に、情報源アルファベットを符号に変換する。

符号化の形式化1 符号:符号語 の集合 符号化 ここで 情報源アルファベット 復号化 符号:符号語     の集合 符号化 ここで 情報源アルファベット 復号化 符号アルファベット:符号に用いられる記号  の集合。この個数が   のとき、   元符号という。 符号記号:符号に用いられる記号

符号化の形式化2 符号化は、一種の関数とみなせる。 符号化 符号語長 全単射が多い 復号化 復号化は、符号化の逆関数とみなせる。

符号化の例 情報源 を、符号アルファベットを とする2元符号化する。 符号化の関数を求めることを符号化ということもある。 を、符号アルファベットを           とする2元符号化する。 符号化の関数を求めることを符号化ということもある。 このとき、符号長の集合  は以下で与えられる。

練習 次の文字列を符号   に従って符号化せよ。 (1) (2)

練習2 次の文字列を符号   に従って復号化せよ。 (1) (2)

平均符号長 定義:平均符号長 の符号長の集合を                  とする。 このとき、平均符号長     は次式で定義される。 平均:確率を乗じて総和を取る。

平均符号長例1 情報源 の符号を とする。 このとき、符号長の集合は、 であるので、平均符号長 は、次式で求められる。 情報源                        の符号を                                    とする。 このとき、符号長の集合は、                       であるので、平均符号長   は、次式で求められる。 確率の大きい記号には短い符号を、 確率の小さい記号には長い符号を用いた方が効率が良い。

平均符号長例2 情報源 の符号を とする。 このとき、符号長の集合は、 であるので、平均符号長 は、次式で求められる。 情報源                        の符号を                                    とする。 このとき、符号長の集合は、                       であるので、平均符号長   は、次式で求められる。 確率の大きい記号に長く、確率の小さい記号に短ると平均符号長が長くなる。

平均符号長の効果 約40文字 (       ) 情報源からの20文字 約60文字  (        )

練習 S:スペード(Spade) H:ハート(Heart) (1)情報源 D:ダイヤ(Diamond) C:クラブ(Club) (1)情報源                    に対する符号を とする。このとき、平均符号長を求めよ。 (2)同じ情報源に対して、別の符号を割り当て、(1)より平均符号長を短くせよ。また、そのときの平均符号長を求めよ。

等長符号と可変長符号 定義:等長符号と可変長符号 ある符号を とし、その符号長集合を とする。 符号長 が全て等しいとき、 ある符号を              とし、その符号長集合を                とする。 符号長               が全て等しいとき、     を等長符号をいう。 長さの異なる符号             が存在するとき、     を可変長符号という。 等長符号 可変長符号

等長符号の平均符号長 性質:等長符号の平均符号長 等長符号の平均符号長は、ある一つの記号の符号長と等しい。

等長符号例 平均符号長      は、次式で求められる。

符号例一覧 平均符号長 可変c長符号 等長符号

符号のクラス(符号の分類) 復号からの分類 符号 一意復号化可能な符号 一意復号化不可能 な符号 瞬時符号 (瞬時に復号化可能な符号) 特異符号 一番重要

特異符号 定義:特異符号 2つ以上の情報源記号に、一つの符号語を対応させた符号を特異符号という。 特異符号例 ?

復号化の一意性 定義:一意複合可能 符号記号の系列から、対応する情報源の系列を一意に求められ符号を一意に復号可能な符号といい、一意に求められない符号を一意に復号不可能な符号という。 特異符号のように符号記号毎に一意に復号不可能な場合だけでなく、系列として一意に復号不可能場合も含む。もちろん次の命題は成り立つ。 性質:特異符号の一意複合不可能性 特異符号は一意に復号不可能な符号である。

一意に復号不可能な符号例 特異符号ではない ?

瞬時符号 定義:瞬時符号 情報源記号の系列を符号化したものが、時系列で送られるとする。このとき、符号記号の系列から情報源記号の区切りが瞬時に判断できる符号を瞬時符号という。 (ここで、瞬時とは、次の情報源記号の符号語が送られてこなくても、符号語の終わりが判別できることを指す。) この時点で 1記号復号できる。

瞬時符号例 瞬時符号 符号語の区切り 復号可能な時点

非瞬時符号例 非瞬時符号 符号語の区切り ? 復号可能な時点   は一意復号可能な符号であるが、 瞬時復号可能な符号ではない。

練習 次の2つの符号に対して、与えられた通報を符号化し、さらに 復号化せよ。 (1) (2)

符号の木 符号を一つの木として捉えると、符号の性質を理解しやすい。 ここでは、2元符号についての符号の木を示す。 定義:符号の木 接点:符号記号の区切り 枝:符号記号 として、各接点から2分岐(r元の場合はr分岐)させた木を符号の木という。各符号語は根から対応する接点までの経路上の符号記号の系列として求められる。

:区切り 0:上の枝 1:下の枝 :符号語に対応 根という。 1 葉という。 1 1 1 1 1

符号の木の例 瞬時符号は、符号語が葉にしか割り当てられない。 1 1 1 1 符号長に対応(深さという)

符号の木の例2 非瞬時符号は、符号語が葉以外にも割り当てられる。 1 1 1 1

練習 以下の符号に対して、符号の木を作成せよ。 (1) (2) (3)

瞬時符号の性質1 性質:符号の木を用いた瞬時符号の判別 瞬時符号であるための必要十分条件は、 符号の木として表現したとき全ての符号語が葉に割り当てられていることである。

語頭 定義:語頭 符号語                    に対して、           を(符号語   の)語頭(prefix)という。 の語頭

(瞬時符号の)語頭条件 性質:語頭を用いた瞬時符号の判別 瞬時符号であるための必要十分条件は、 各符号が他の符号の語頭になっていない。 語頭 空集合 これらが符号に含まれない。

クラフトの不等式 符号長で瞬時符号を特徴づけることができる。 性質:クラフトの不等式 符号語長の集合が であるような 符号語長の集合が             であるような r元瞬時符号              が存在するための必要十分条件は、次式が成り立つことである。 この不等式をクラフトの不等式という。 性質:2元符号のクラフトの不等式 2元符号({0,1}への符号化)の場合のクラフトの不等式

クラフトの不等式のイメージ 1 1 1 1

クラフトの不等式の確認

クラフトの不等式の利用 クラフトの不等式はあくまでも、瞬時符号の符号長に関する条件である。したがって、以下の命題しか成り立たない。 瞬時符号である。 クラフトの不等式を満足する。 例えば、                              の符号はクラフトの不等式を満足するが、瞬時符号ではない。

練習 以下の符号に対して、クラフトの不等式を満たすか調べよ。 また、瞬時符号かどうかを答えよ。 (1) (2) (3)

情報源符号化定理(平均符号長の下限) 性質:情報源符号化定理(重要) 無記憶情報源   の    次拡大情報源     に対して、次式を満たす平均符号長    を持つr元瞬時符号が構成できる。 この定理の理解が当面の目標 性質:2元符号版の情報源符号化定理 エントロピーの重要性の再確認。 平均符号長の下限がエントロピーである。

拡大情報源 ここでは、情報源について再考する。 定義:拡大情報源 情報源           に対して、   の情報源記号を   個並べた順列すべてを情報源アルファベットとする情報源を   (元の情報源)の   次拡大情報源といい   と表す。すなわち、 Sの記号をN個ならべて新たな記号とする。

拡大情報源例 の2次拡大情報源を求める。 まず、2次拡大情報源アルファベットは以下のようになる。 2記号で、 1情報源記号扱いに注意する。 次に、各確率を求める。

の3次拡大情報源は以下となる。

練習 次の拡大情報源を求めよ。 (1) の2次拡大情報源   。 (2) の3次拡大情報源   。

拡大情報源のエントロピー 性質:拡大情報源の平均符号長 無記憶情報源 の平均符号長を とし、 無記憶情報源   の平均符号長を   とし、    の   次拡大情報源     の平均符合長を         とする。このとき、次が成り立つ。 エントロピーはN倍。エントロピーが1記号あたり の情報量であることから、妥当といえる。 拡大情報源の1記号には、元の情報源記号がN個含まれる。

練習 次のエントロピーをそれぞれ求めよ。 (1) に対して、      および (2) に対して、      および

平均符号長の性質 性質:瞬時符号の平均符号長 無記憶情報源   に対して、次式を満たす平均符号長    を持つr元瞬時符号が構成できる。

証明 証明方針: (1)クラフトの不等式を満たす符号長集合を持つ符号を構成する。(瞬時符号では必ず存在する。) (2)構成した符号が命題の式を満たすことを示す。 (1) に対して この式を満たす自然数はいつも一つだけ存在する。 を満たす符号長集合                を持つ符号                を構成する。 この符号がクラフトの不等式を満たすことを示す。

左の不等号より、 符号全ての和をとる。 クラフトの不等式 よって、クラフトの不等式を満たす。(したがって、 前のスライドの条件を満たす符号が存在する。)

(2) 各項に     を乗じる。 辺々総和をとる。 平均符号長 確率の和 分子はエントロピー したがって、次式が成り立つ。 QED.

情報源符号化定理の証明 性質:情報源符号化定理(シャノンの第1定理) 証明 N次拡大情報源 に対して瞬時情報源の平均符号長の性質を適用する。 さらに、拡大情報源の平均符号長の性質を適用する。 QED.

符号の効率と冗長度 定義:符号の効率 次式で定められる を符号の効率という。 効率的 非効率的 (符号が極端に長い) 定義:符号の冗長度 次式で定められる   を符号の効率という。 効率的 非効率的 (符号が極端に長い) 定義:符号の冗長度 次式で定められる   を符号の冗長度という。 冗長的 (符号が極端に長い) 冗長性なし

符号の効率の計算 情報源                      の符号 の効率を求める。

練習 次の情報源に対する符号の効率を求めよ。 (1) (2)