情報基礎 講義番号:X61029 科目区分:教養教育科目 対象年次:1-4 必修 クラス指定 工(応化) 講義の内容 対象年次:1-4 必修 クラス指定 工(応化) 講義の内容 コンピュータの構造や歴史を理解し、基本的な情報処理に関する能力を身に付ける。 成績評価方法 小テスト、中間試験、期末試験により総合的に評価する。
情報基礎の位置付け 学習教育目標のC1 数学・自然科学・情報処理に関する基礎知識 C2科目 情報処理I 二年次 コンピュータの理解 への基礎。
化学構造式作成ソフト
なぜ情報理論を学ぶのか コンピュータ知識 ワープロ(文書作成) インターネット(情報収集) 情報処理技術 統計処理(エクセル) ワープロ(文書作成) インターネット(情報収集) 情報処理技術 統計処理(エクセル) シミュレーション(計算機科学) 理系としての基礎知識 実験データの処理、レポート・論文の作成
分子軌道計算
序論 1.情報 2.情報の伝達、蓄積 3.情報の処理、アルゴリズム 授業展開#1 序論 1.情報 2.情報の伝達、蓄積 3.情報の処理、アルゴリズム
情報とは 情報という言葉は、価値観に強く結びついている。価値がなければ、情報は含まれていない。利用する主体の主観に依存 情報技術とは 情報を得る技術、伝える技術、蓄積する技術、暗号など
データと情報 情報=価値のあるデータ。関心のあるデータ 集めたデータは、主観や価値観によって選別され、必要な情報となる。 一方で、 無意味なデータでも、ある人にとっては、貴重な情報源かもしれない。 記号化されたデータや映像化されたデータは情報と同義に扱える。
情報の質 内容:必要な内容が網羅されているか。 時間:更新されているか。 精度:間違いはないか。 よく使う情報はよく更新されるため間違いが少ない。 あまり使わない情報は慎重に評価する必要。 情報が多いと手間・容量・費用の点で大変。 データを検索する・・・基準や整理が必要 情報管理論やデータベース論で重要
情報科学 情報を単なる文字記号列として扱う シャノン情報理論 Claude E. Shannon 情報を単なる文字記号列として扱う シャノン情報理論 Claude E. Shannon 情報を意味内容と直接に関係しない客観的な対象とする。単なる文字列、記号列として、その大きさ(情報量)を量る方法を提案した。 すなわち、情報は文字記号列として表され、情報量は記号の量として量る。
コンピュータ コンピュータは、情報を記号化して扱う。 0か1。2通り。これを1ビット(bit)という。 0か1がいくつか並んだものをビット列という。 ・長さ5のビット列には、25=32通りの可能性がある。 ・長さ5のビット列を5bitという ある文字記号を特定のビット列に対応させることにより、文字記号をコンピュータで扱えるようになる。
情報量 情報量 I(a)=-log2p(a) ( p(a):確率 ) トランプから1枚引いて、ハートである場合の情報量は、 I(a) = -log2(13/52)=2 bit となる。 確率が小さければ小さい程、情報量は多くなる。 「二つに一つ」=- log2(1/2)=1 bit 「万に一つ」 = - log2(1/10000)=13.288 bit 確率が256分の1の事象 =- log2(1/256)=8 bit = 1 byte 1 byte で256種類の事象を記述することができる。
情報の表現と通信 通信:遠隔地に情報を伝えること 伝令、飛脚、伝書鳩・・・・物や人を運ぶ・・・効率が悪い 伝令、飛脚、伝書鳩・・・・物や人を運ぶ・・・効率が悪い のろし、手旗信号、モールス信号、電話・・・・情報を符号化 ノイズ・・・・情報通信の問題の一つ シャノンの通信モデル 送り手 → 符号化 → 通信路 → 復号 → 受け手 encode ↑ decode ノイズ 重要な結論:どんなに誤りを多く発生させる通信路であっても、復号された文字列の誤りを、任意に設定した誤り率以下に抑えるような符号化の方法が存在する。 → CD、インターネット、宇宙通信
符号語間距離 符号語間距離(ハミング距離) 符号語A:0000、符号語B:1111とする。 符号の中で記号が異なっている数を、 符号の中で記号が異なっている数を、 符号語間距離(d)という。(AとBの間では、d=4) ある符号語の集合体において、すべての符号語間距離のうち最小となるものを最小符号語間距離dminと呼ぶ。
誤り訂正符号 誤り訂正符合とは 記憶装置などからデータを読み出す際、データの誤りを訂正するために本来のデータとは別に付加される冗長なデータのこと。 例 集合{0,1}(dmin=1)に対して、 「0」には「000」、「1」には「111」という3シンボルを付加する。 集合{0000, 1111} (dmin=4) 「000」 「111」の冗長な符号語を誤り訂正符合という。これによって、dminが増大する。
誤り訂正の原理 「0010」の間違ったデータ(「0000」:真)が送られて来たとする。 A「0000」からのd=1 A「0000」からのd=1 B「1111」からのd=3 → 本当はAの可能性が高い 1ビット間違える確率を1/100とする 4ビット符号語のうち距離1の符号に誤る確率 →(1/100)×(99/100)×(99/100)×(99/100) 4ビット符号語のうち距離3の符号に誤る確率 →(1/100)×(1/100)×(1/100)×(99/100) 両者の差は10000倍である。
誤りが起こってもある符号語からt以内の距離にあれば、その一番近い符号語に訂正すればよい どの符号語からもt以上離れている場合は誤りが起こったという検出のみ可能 前ページの例の場合、 ・{0001、0010、0100、1000}と検出 → {0000}に訂正 ・{1110、1101、1011、0111}と検出 → {1111}に訂正 ・{0011、0110、1001、1010}と検出 → 訂正不可能
符号語間距離 1234 d=1 1235 d=1 1236 d=1 どれかわからない 1237 d=1 が誤り 1238 d=1 1239 d=1 集合 1234 1235 1236 1237 1238 1239 1234が1233 と誤ったら… 集合 1234A 1235B 1236C 1237D 1238E 1239F 符号語間距離 1234A d=1 ← これっぽい 1235B d=2 1236C d=2 1237D d=2 1238E d=2 1239F d=2 1234Aが1233A と誤る
一般に、符号がt個までの誤りを訂正できるための必要十分条件は、どの符号間距離を取っても2t+1以上あることである。 dmin≧2t+1 逆にdminがわかっている時、誤り訂正能力t(c)は次のように表される。 t(c)=int[(dmin-1)/2]
通信と暗号 機密情報の保護 プライバシー、ネット取引・・・暗号化が必要 暗号化の方法 プライバシー、ネット取引・・・暗号化が必要 暗号化の方法 換字法:文中の文字を他の文字に置き換えて、意味のない文字列とする方法 キー変換方式:キーと呼ばれる特定の文字列によって、変換する方法
情報の蓄積と通信 時間を隔てて情報を利用するためには、情報の蓄積が必要である。 情報を記号化し、メモリやディスクに書き込み、ネットワークで送ることは、情報の蓄積・通信である。
制御と情報 水洗トイレの水流制御:レバーを動かすと水が流れ、給水弁が開いて給水し、満水になると弁が閉まる。 水槽内のフロートは水位情報を測定するセンサ 水位情報は、記号列ではない。 エアコンの温度制御:センサから得られる情報を数値化し、コンピュータによる総合判断を行って制御する。 温度情報はデジタル化され記号列で処理される。
情報の表現・情報の蓄積と通信・情報の処理とアルゴリズムは情報科学の対象である。 情報は通信のみならず、処理の対象でもある。 情報の処理:記号列で表された情報を別の記号列に変換すること。 例 2つの数値の積を計算する。 アルゴリズム:コンピュータを使ってある特定の目的を達成するための情報処理の方法、処理手順。アルゴリズムをプログラミング言語を用いて具体的に記述したものをプログラムという。 情報の表現・情報の蓄積と通信・情報の処理とアルゴリズムは情報科学の対象である。
情報倫理 情報社会においては、著作権などの知的財産権、プライバシー権などに注意する必要がある。 不正コピーの防止 個人情報保護 ウイルス ハッキング
演習 情報とはいったいどういった概念か。 通信手段をいくつか例示せよ。 情報通信の時に起こる問題とは何か。 記数法について例を2つ挙げよ。 古いフランスの貨幣単位の例 1リーブル=20スー、1スー=12ドゥニエとする。 8リーブル16スー7ドゥニエの品物と11リーブル18スー8ドゥニエの品物を購入した時の合計金額はいくらか。また、30リーブル出したときのおつりはいくらか?