環境数理モデル特論A (情報理論) 2016年8月8‐9日 於岡山大学環境理工学部 渡辺宏太郎 防衛大学校情報工学科教授.

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

環境数理モデル特論A (情報理論) 2016年8月8‐9日 於岡山大学環境理工学部 渡辺宏太郎 防衛大学校情報工学科教授

参考書 (1) 「情報理論と符号理論」 J.A.ジョーンズ,J.M.ジョーンズ著 (2) 「情報理論」 今井秀樹著 (2) 「情報理論」 今井秀樹著 (3) 「例題で学ぶ符号理論入門」 先名健一著 (4) 「誤り訂正技術の基礎」 和田山正著 (5) 「Error Correction Coding」 Todd K. Moon著 情報理論については(2)を読むとおおよその感じをつかめると思います. (3)は例題が豊富で大変わかりやすい. (5)は変調方式を含めてさらに理解を深めるにはよい一冊のように思います. 値段が高いのがネックでしょうか. (4)は日本語でLDPC符号の解説がされているのがありがたい.

情報理論,符号理論とは 情報の伝達を如何に効率よく,信頼性高く行うかに関する理論.20世紀の半ばにシャノン(C.E. Shannon)により構築された.符号理論はその具体的アルゴリズムにあたるものである Claude E Shannon's father was also named Claude Elwood Shannon and his mother was Mabel Catherine Wolf. Shannon was a graduate of the University of Michigan, being awarded a degree in mathematics and electrical engineering in 1936. Although he had not been outstanding in mathematics, he then went to the Massachusetts Institute of Technology where he obtained a Master's Degree in electrical engineering and his Ph.D. in mathematics in 1940. Shannon wrote a Master's thesis A Symbolic Analysis of Relay and Switching Circuits . His doctoral thesis was on population genetics. Shannon joined AT&T Bell Telephones in New Jersey in 1941 as a research mathematician and remained at the Bell Laboratories until 1972. D Slepian, a colleague at the Bell Laboratories wrote:- Many of us brought our lunches to work and played mathematical blackboard games but Claude rarely came. He worked with his door closed, mostly. But if you went in, he would be very patient and help you along. He could grasp a problem in zero time. He really was quite a genius. He's the only person I know whom I'd apply that word to. Shannon published A Mathematical Theory of Communication in the Bell System Technical Journal (1948). This paper founded the subject of information theory and he proposed a linear schematic model of a communications system. This was a new idea. Communication was then thought of as requiring electromagnetic waves to be sent down a wire. The idea that one could transmit pictures, words, sounds etc. by sending a stream of 1s and 0s down a wire, something which today seems so obvious as we take this information from a server in St Andrews, Scotland, and view it anywhere in the world, was fundamentally new. (ウィキペディアより)

情報伝達のモデル 情報が伝えられてゆく過程は大まかに次の3つから構成される. (1)伝送される情報 (2)情報を送る人(送信者)と受け取る人(受信者) (3)情報が伝送される通り道(伝送媒体・手段) 例えばAさんがBさんに携帯電話で電話をかけるときは, (1)の情報は,Aさんの発する言葉 (2)の送信者はAさんであり,受信者はBさん (3)の伝送媒体・手段は電波や光ケーブル である.

前のページの情報伝達のモデルを少し詳しく見ると・・・以下のようなシステムになっていることがわかる. (雑音) 外乱 符号化 復号化    情報源符号化        通信路符号化        通信路復号化        情報源復号化     情報源 通信路 受信者 通信システムのモデル 情報源・・・送信者の発する情報 符号化・・・英文の通信を考える.英文のまま通信することはできないから英文を符号化する必要がある. A 0x41 0100 0001 B 0x42 0100 0010

情報源符号化 情報源の統計的性質を利用して効率の向上を図る符号化 情報源符号化 情報源の統計的性質を利用して効率の向上を図る符号化 例えば各英文字を頻度の高い文字には短い系列を割り当て,頻度の低い文字には長い系列を割り当てる. 具体的方法 ハフマン符号化,ランレングス符号化,シャノン・ファノ符号 情報源復号化 0,1系列から受信者が利用できる元の情報,例えばアルファベット記号に変換する作業 通信路符号化 現実の通信路においては種々の原因に起因して雑音による誤りが生じる.これをできるだけ排除して誤りの無い情報の伝達を実現するためには,これに対する対策を講じる必要がある.この誤り対策のための符号化を通信路符号化という. 例1 0 1 0 0 0 0 1 1 1 0 0 0 (各記号を繰り返し3回送る) (3回中1回誤っても正しく復号できる) 詳しくは符号理論(後半7回)で論じられる. 具体的方法として ハミング符号,巡回符号,BCH符号等がある.

情報源通信路符号化の比較

情報源の種類 何故確率を導入するのか? 記号の定義 離散情報源 (ディジタル情報源)・・・・だいたいはこちらを仮定する. 離散情報源 (ディジタル情報源)・・・・だいたいはこちらを仮定する. 連続的情報源 (アナログ情報源) 記号の定義 情報源アルファベット(”晴れ”,”雨”,”曇り”)といった情報を記号的に と表したもの.時刻iでの情報源の出力を で表す.            の確率分布を とする.         は  の任意の元. 何故確率を導入するのか? 頻度の大きい情報源には短い符号化を与え,頻度の小さい情報源には長い符号化を 与えれば直感的に効率的となることから確率導入の意義がわかるだろう.

符号のクラス 例 符号の分類とその特徴づけを勉強しよう. 情報源アルファベットを実際に伝達する場合,情報源記号を符号に変換することが必要なる. これを符号化とよぶ.具体的には情報源アルファベット に対する符号を構成することが符号化である. 例           としよう.例えばa→0,b→10,c→110,d→1110とすることが符号化である.

平均符号長 問1 例1でa→1110,b→110,c→10,d→0とすると平均符号長はどうなるか? 符号語   を構成する記号の個数  を符号語長とよぶ.平均符号長  は        で表される. 例えば例1の平均符号語長は            だからL=1×0.4+2×0.3+3×0.2+4×0.1=2である. 平均符号長を小さくするには大きい出現確率をもつアルファベットに短い符号,小さい出現確率をもつアル ファベットに長い符号を割り当てればよい. 問1 例1でa→1110,b→110,c→10,d→0とすると平均符号長はどうなるか?

符号のクラス 問2 次の符号は上の図のどこにあてはま 特異符号とは1つの符号語を異なる記号に割り当てた符号である.瞬時符号とはその符号が送られた瞬間に復号できる符号のことである. 問2 次の符号は上の図のどこにあてはま るか? (1) a→0,b→10,c→10,d→11 (2) a→0,b→01,c→10,d→11 (3) a→0,b→10,c→110,d→1110 (4) a→0,b→01,c→011,d→0111 (答) (1) bとcに同じ符号を割り当てているから特異符号である. (2) 特異符号ではないが,0110がbcなのかadaなのか区別がつかないから一意に復号化不可能な符号である. (3) ある符号を得たときその符号に続きがあって他の符号になるということはないから瞬時符号である. (4) 例えばaを得ているとしよう.このとき後に1が来ればc,dの可能性がある.運良く0が来ればaと判断できる. 直後に0を得た時点でどの符号を得ているかわかるということは全ての場合にあてはまる.このことからこの符号 は一意に復号可能だが瞬時符号でないことがわかる.

問3 (3)と(4)の違いは符号木を描いてみるとよくわかる.符号木を描いてみよ. 問3 (3)と(4)の違いは符号木を描いてみるとよくわかる.符号木を描いてみよ. 問3の答 図から次のことがわかる. 定理 次の(1),(2)は同値である. (1)瞬時符号である. (2)全ての符号語が符号木の枝の末端(葉)に 割り振られている. 定理 等長符号(符号の長さが全て等しい符号) は特異符号でなければ,瞬時符号である. (証明)  等長符号は符号木の枝の末端(葉)に割り 振られている.

問4 情報源S={a,b,c,d,e}を次の表のように符号化した.符号C1~C6について以下の問に答えよ. 10 110 1110 1011 1 001 011 101 11110 01 0111 01111 100 111 000 0010 0011 (1)  ,  は一意に復号化不可能な符号らしい.理由を述べよ. (2)瞬時符号を列挙せよ (3)情報源Sの発生確率を        とする. 瞬時符号でこの情報源に最も適した符号はどれか? (ヒント 平均符号長を計算せよ)   問4の答

クラフトの不等式 定理 符号語長 をもつr元瞬時符号が存在するための必要十分条件は次の不等式をみたす ことである.                        (クラフトの不等式) 注意 クラフトの不等式は瞬時符号であるための必要十分条件ではなく瞬時符号が存在するための 必要十分条件である.つまり符号語長 がクラフトの不等式をみたしていれば,うまくを構成すれば 瞬時符号にできるということである. 注意の例 問2の (3)a→0,b→10,c→110,d→1110 (4)a→0,b→01,c→011,d→0111 で(3)は瞬時符号で(4)はそうではなかった.しかし,共に となりクラフトの不等式をみたす.よって   「瞬時符号である」     「クラフトの不等式をみたす」 という関係式が成り立つことがわかる.

定理の証明 1ℓ 2元符号の場合を考えよう.木の根に量1の水をあたえることにしよう.この水は最初の枝で1/2と1/2 に分流し,次の分岐でもまた2分され  と   に分流される.同様にしてm次の分岐では  と  に 分流されることがわかる.符号語に対応するノード(葉)の下にバケツをおき,バケツに流れてくる水量を すべてのバケツについて足し合わせたものがクラフトの不等式の左辺となる. 明らかに瞬時符号ではバケツの水の総和は1以下となることがわかる. 逆にクラフトの不等式がみたされるならば,  に対して  -1次の葉を選んでやれば瞬時符号が 構成できることがわかる. 1ℓ

問5 問5の答 情報源S={a,b,c,d}に対する次の符号長を持つ瞬時符号が構成できるかどうか判定せよ. 構成できるものについてはその例を挙げよ. (1)(1,2,2,2)の2元符号 (2)(1,2,2,2)の3元符号 問5の答

情報源符号化定理 さてシャノンの情報源符号化定理(シャノンの第1定理)について述べる.シャノンの第1定理を述べるためには,N次拡大情報源とエントロピーの概念が必要である.  

問6の答

エントロピー 問7の答

定義(エントロピー) N次エントロピーを用いてエントロピーは定義される

シャノン―ファノ符号 で定義する

補題の証明(続き)

LがH1(S)を下回らないことについて 補題 (証明)

(証明終)

問8の答

情報源符号化定理

情報源符号化定理証明の続き

ハフマン符号化

ハフマン符号はコンパクト符号(1) 𝛼 𝛼 𝛼′ 𝛼 𝛼 𝛼′ 補題 コンパクト瞬時符号の最も長い符号語に対応する葉は2枚ある. 補題 コンパクト瞬時符号の最も長い符号語に対応する葉は2枚ある. 2枚の葉は確率の最も小さい2つの情報記号に対応する. 𝛼 (証明) 平均符号長が短くなる. コンパクト符号 であることに矛盾 𝛼 1 符号が割り当て られていない 𝛼′ 𝛼 最も長い 符号語 1 1 𝛼 𝛼′ 1 矛盾 1 1 1 コンパクト符号

ハフマン符号はコンパクト符号(2) a(0.6) b(0.25) c(0.1) d(0.05) (0.15) (0.4) (1.0)

ハフマン符号はコンパクト符号(3) (1.0)

平均情報量(エントロピー) X:実際の天気の(結合)確率分布, Y:天気予報の(結合)確率分布   X:実際の天気の(結合)確率分布, Y:天気予報の(結合)確率分布 Y 晴 雨 X 0.45 0.12 0.57 0.15 0.28 0.43 0.60 0.40   (1)平均情報量(エントロピー)Xについてのあいまいさ 上の例だと =0.986(ビット)

条件付きエントロピー (2)条件付エントロピー Yを知ったとき,Xについて残っているあいまいさ (2)条件付エントロピー Yを知ったとき,Xについて残っているあいまいさ Y 晴 雨 X   Y=晴だったとき,Xについての残っているあいまいさは これらを平均すると0.6×0.811+0.4×0.881=0.839(ビット) 式で書くと

条件付きエントロピー(2) 上式に を代入してみると

相互情報量I(X;Y) (3)相互情報量 I(X;Y) Yを知って得たXについての情報量 Yを知って得たXについての情報量=   Yを知って得たXについての情報量= (Xについてのあいまいさ)-(Yを知ったとき,Xについて残っているあいまいさ) これを式にすると となる.XとYを入れ替えて考えると であるからI(X;Y)=I(Y;X)がなりたつ.

X:実際の天気の(結合)確率分布, Y:天気予報の(結合)確率分布が次のように与えられている.このとき, 問13 X:実際の天気の(結合)確率分布, Y:天気予報の(結合)確率分布が次のように与えられている.このとき, Y 晴 雨 X 4/9 2/9 2/3 1/9 1/3 5/9   (1)平均情報量H(X)を求めよ (2)条件付エントロピーH(X|Y)を求めよ (3)相互情報量I(X;Y)を求めよ  全て      を用いて表せ.

通信路の符号化  シャノンの第1定理(情報源符号化定理)では平均符号長をできるだけ短くするように,情報源系列を符号語系列に変換する情報源符号化について勉強した.しかし,情報源符号器の出力をそのまま通信路に入力すると,雑音などの通信路における誤りのため,通信路の出力が入力とは異なる符号語系列になる可能性がある.001101を送信符号とする.このとき通信路内で雑音が入り4ビット目が反転し,001001になってしまったとしよう.このとき,もし同じ符号を3回続けて送信するということにしておけば送信符号は000/000/111/111/000/111となる.ここで4ブロック目が雑音により011となったとしても0と1の多いほうに符号を決定するというルールにしておけば,011を111に訂正することができる.このように符号を冗長化することにより誤り訂正ができるようになる.  上記の符号化は繰り返し符号化とよばれる単純な符号化で送りたい情報ビット数に対して3倍,5倍,7倍のビット数を用いなければならない.  シャノンの第2定理(通信路符号化定理)は冗長度を0に漸近させなくとも(繰り返し符号化では0に漸近する)任意のε>0対して十分長い符号長n0が存在してn>nならば復号誤り率がεi以下とできるような符号が存在することを主張する.  符号長の長さが必要となるものの繰り返し符号化と較べれば,魅力的な結果を述べていることがわかることだろう.

通信路行列

通信路のモデル 例 2元対称通信路(Binary Symmetric Channel) X Y 例 2元消失通信路(Binary Erasure Channel) X Y

問14

問15 問16

通信路容量

問17 2元対称通信路の通信路容量はC=1-H(p)= であることを示せ. 問18

復号誤り率 最尤復号では送信記号は等確率で発生することを仮定する

繰り返し符号の復号誤り率 問19

符号化率

通信路符号化定理

通信路符号化定理の証明(1) 通信路は2元対称通信路で送信誤り確率をpとする.

通信路符号化定理の証明(2) CはBSCの通信路容量 どのような符号であるかは不明 途中の不等式の証明

ディジタル変調の観点から  さらに進んで情報理論や符号理論の論文を読んで行く場合,最尤復号を行った際のビットエラー率が情報ビット当たりの搬送波のエネルギーとノイズのエネルギーの比で説明なしに表されることに戸惑ってしまう場合が多いように思います.   この辺が敷居の高さを高めていて,数学分野の人がこの分野に入って行きにくい原因の1つになっているような気がします.この講義では,その敷居の高さを低くすることを目指してみます. 1 を表すこととする.この送信方法を Binary Phase Shift Keying(BPSK)変調という.

BPSK変調信号の復号 1 格好つけた言い方をすると マッチドフィルタリングという

ノイズについて

最尤推定(1) (証明)なんだか自明なような気がしますが,では証明してみなさいと言われると以下のようになるのではないでしょうか. とすると よって正しく復号する確率は

最尤推定(2) この量を最大にする を選ぶ推定を最尤推定とよぶ.  

BPSK変調の場合 だから   とおくと  

BPSK変調におけるビットエラー率

符号化率R=k/nの符号の BPSK変調におけるビットエラー率 情報kビット 冗長n-kビット

符号化率R=k/nの符号の BPSK変調におけるビットエラー率 情報kビット 冗長n-kビット

2元対称通信路のビットエラー率と BPSK変調におけるビットエラー率

BPSK変調通信路における シャノン限界(1) R

BPSK変調通信路における シャノン限界(2) LDPC符号がシャノン限界 付近で良い復号性能を もっていることがわかる このシャノン限界は Binary Additive White Gaussian Noise Channel (BAWGNC通信路 の通信路容量に基づ いて計算した値である) 2元対称通信路の 通信路容量に基づく 計算ではない.

BPSK変調通信路における シャノン限界(3) BAWGNC BSC BAWGNC通信路では,入力Xは バイナリ(0または1)だが,出力Y は連続値(-∞,∞)を許す. 従って通信路容量:Yを知ったとき Xについて得る情報量は増大する.

BAWGNCの通信路容量 問20(レ) Yが実数全体をとるときは

R=C=1/2であることを確かめた.

X,Yが共に実数全体のとき シャノンーハートレ 問23 問22(レ)