「情報」 (中村) オリジナル PPT (2010/05/07) 1 1.

Slides:



Advertisements
Similar presentations
2009/11/10 10 進数と r 進数を相互に変換できる コンピュータのための数を表現できる 2進数の補数を扱える コンピュータにおける負の数の表現を説明で きる コンピュータでの演算方法を説明できる 文字や記号の表現方法を示せる 第7回 今日の目標 § 2.2 数の表現と文字コード.
Advertisements

7章 情報の表現と基礎理論. 数の表現(書き方) 「数」と「数の書き方」をわけて考える 「数の書き方」と,「数そのものの性質」は別のもの 例:13 は素数・・・”13”という書き方とは無関係 ここでは書き方(表現方法)について考える 567.
2.5 プログラムの構成要素 (1)文字セット ① ASCII ( American Standard Code for Interchange ) JIS コードと同じ ② EBCDIC ( Extended Binary Coded Decimal for Information Code ) 1.
情報量と二進法での四則演算 香川大学工学部 富永浩之 情報数学1 第 3-2 章.
基本編の用語説明 その2 エディタと日本語入力 エディタ  エディタ (editor) :文書を作成、編集する アプリケーションソフトウェア  教育用計算機システムのエディタは、 テキストエディット テキストエディット  基本的な編集方法はここここ  カーソル:文字が入力される位置を表している目印.
復習 配列変数の要素 5は配列の要素数 これらの変数をそれぞれ配列の要素と呼ぶ この数字を配列の添え字,またはインデックスと呼ぶ
復習 配列変数の要素 5は配列の要素数 これらの変数をそれぞれ配列の要素と呼ぶ この数字を配列の添え字,またはインデックスと呼ぶ
授業展開#3 アナログとデジタル.
第1節 コンピュータにおける 情報のあらわし方
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
富山大学 公開講座 2008 「QRコードを作ろう!」 ~ QRコードを作ろう! ~.
情報通信システム(3) plala. or 情報通信システム(3) 年5月10日 火曜日  午後4時10分~5時40分 NTT-IT Corp. 加藤 洋一.
第1章 第1節 情報のディジタル化のしくみ 4 音の表現 5 画像の表現
情報処理の基礎 私たちとコンピュータの扱うデータの違い 明治学院大学 法学部消費情報環境法学科 鶴貝 達政
2004, Spring term, Yutaka Yasuda
第1章 第1節 情報のディジタル化のしくみ 4 音の表現 5 画像の表現
アナログとディジタル 五感 視覚、聴覚、味覚、臭覚、触覚 埼玉県立越ヶ谷高等学校・情報科.
コードの歴史 ASCII(American Standard Code for Information Interchange)  ANSI ISO 646 = 95文字のラテン文字 アルファベット+数字+特殊文字 制御コード: LF, CR などの表示制御と   ACK,DEL などの通信制御 、など.
文字のディジタル化 Copyright(C)2009 Tsutomu Ohara All rights reserved.
地理情報システム論 第3回 コンピュータシステムおける データ表現(1)
第2章 ソフトウェアの基礎知識 電子制御設計製図Ⅰ    2010年5月11日 Ⅲ限目.
コンピュータ基礎実習上級 #11画像ファイルと文字のフォーマット
第2章 ソフトウェアの基礎知識.
心理学情報処理法Ⅰ コンピュータにおけるデータ表現 マルチメディアとコンピュータ.
プログラミング言語論 プログラミング言語論 プログラミング言語論 演習1 解答と解説 演習1解答と解説 1 1.
情報のディジタル化 情報量の単位(bit) 文字 数値 アナログ情報.
アナログとディジタル 高校1年 社会と情報⑤.
マルチメディア情報の ディジタル表現と処理
2012年度 情報数理 ~ QRコードを作ろう!(1) ~.
2008年度 情報数理 ~ QRコードを作ろう!(1) ~.
1.コンピュータと情報処理 p.14 第1章第1節 1.わたしたちの生活と情報技術 情報機器の発展 情報機器は,アナログデータから
10.通信路符号化手法2 (誤り検出と誤り訂正符号)
アナログとディジタル 教科書 P8~30,資料8,12 埼玉県立大宮武蔵野高等学校・情報科.
報告4:蔵書評価における文字コード問題について
情 報 A ー ディジタル化のしくみ ー.
2010年度 情報数理 ~ QRコードを作ろう!(1) ~.
画像のディジタル化 1 A/D変換器 光強度のアナログ情報をディジタル信号に変換する 標本化:sampling
情報機器の発達とディジタル化 第2節 情報のディジタル化
第3回: 今日の目標 平均情報量を説明し、計算できる シャノンの通信モデルを説明できる 情報源符号化の条件を示せる
ディジタル信号処理 Digital Signal Processing
情報機器の発達とディジタル化 第2節 情報のディジタル化②
授業展開#3 アナログとデジタル.
情報科学Ⅰ 担当教員:幸山直人.
動画ファイル形式 コンピュータでは、文字や画像、動画、音声といった様々な種類の情報を扱うことができるが、記憶装置に記録されるデータそのものは0と1の情報でしかない。動画ファイルの形式としてはMPEGやAVIです。
第4回 信号表現とエリアシング.
2008年度 情報数理 ~ 様々なデジタル情報 ~.
文字コード 情報処理3 今井孝明.
独習XML 第2章 XML文書の構成要素 2.1 XMLの文字と文字列 2.2 コメント
文字の表現.
第4回 コンピューティングの要素と構成 平成22年5月10日(月)
Ibaraki Univ. Dept of Electrical & Electronic Eng.
音・音楽の設計と表現Ⅱ キーワード : サンプリング(標本化)、周波数、量子化 音は空気を伝わる波 → 音をデジタル(0と1の数値)にする。
文字エンコーディング 2010年7月.
第2章 ソフトウェアの基礎知識 電子制御設計製図Ⅰ    2010年5月19日 Ⅱ限目.
文字のディジタル化 Copyright(C)2009 Tsutomu Ohara All rights reserved.
2012年度 情報数理 ~ 様々なデジタル情報(1) ~.
画像の情報量 Copyright(C)2008 Tsutomu Ohara All rights reserved.
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
本時の目標 コンピュータが情報を処理するしくみを知る。
情報A 第15回授業 04情報のディジタル化 対応ファイル:12exp15.xls
2010年度 情報数理 ~ 様々なデジタル情報(1) ~.
アナログとデジタル.
地理情報システム論(総)/ 国民経済計算論(商)
第2回 標本化と量子化.
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
情報の授業 サイバースペースに飛び込もう(2) 情報のデジタル化 Go.Ota
日本語独特のL10N問題とは? 各社仕様の拡張文字 複数の符号化 規格の混乱など Unicodeとのマッピング
CADシステムとソフトウェア 電子制御設計製図Ⅰ    2009年4月28日 Ⅲ限目.
2019年度 情報数理特論B ~ 様々なデジタル情報(1) ~.
コンピュータと音 B3 入野仁志(irino).
Presentation transcript:

「情報」 (中村) オリジナル PPT (2010/05/07) 1 1

第2章  情報の表現 記号・符号化

10進法と16進法の表記の比較 A45F = 42,079 44,604 = FA3C グレイ符号 構成法は HTML で説明 整数の表現-2進法10進法16進法 11 10001 17 10 10000 16 F 1111 15 E 1110 14 D 1101 13 C 1100 12 B 1011 A 1010 9 1001 8 1000 7 111 6 110 5 101 4 100 3 2 1 16 進法 2 進法 10 進法 グレイ符号 10進法と16進法の表記の比較 00000 00001 00011 00010 00110 00111 00101 00100 01100 01101 01111 01110 01010 01011 01001 01000 10000 11001 A45F = 42,079 44,604 = FA3C グレイ符号 構成法は HTML で説明 3

文字・記号とコード化の種類(1バイト文字=半角文字) ■ASCIIコード(1バイト文字=半角文字) (American Standard Code for Information Interchange) 1963年にアメリカ規格協会(ANSI)で定められた文字コード。 7ビット128文字で構成されている。94文字がアルファベット・数字・記号等の印刷可能な文字。34文字が空白文字と制御記号。 滅多に文字化けしない。 ・実際には7ビットに、1 ビットのパリティビット加えた               8 ビット (1 バイト) で扱われる。  Def. 1バイト=8ビット それゆえ、メモリなどの容量を示すのにバイトが使われる。(基本的に文字数をそのまま表すから。) 4 4

ASCII コード a  (0110 0001) b  (0110 0010), c  (0110 0011) これらの8ビットの 0, 1 の列の内、最後の7ビットで文字を表現し、ゆえに、2の7乗つまり128通りあるから、計算機内では余分な 1 ビットを加えて、8 ビット= 1 バイト (byte) で表現している。 ( 1 byte = ASCII 文字 1 文字) ■ JISコード (1バイト文字=半角文字) ASCII で表現される文字は、英字、数字、他に ? # などのいくつかの記号である。日本ではこれにカタカナ(半角カナ)を加えてJIS コードとしている。

2バイト文字(全角文字)(日本語の表記) ■ JISコード:日本語で漢字も含めて扱おうとすると、128通りでは足りない。そこで日本では JIS(日本工業規格)によって漢字を表わすコードが定められている。そこでは漢字、ひらがな、カタカナを 16ビット(2バイト)で表わす。 16ビットの列は、2の16乗=65536通りあるので、ひらかな、カタカナと日常に必要とされる程度の漢字をそこに割り当てて、表現できる。 JIS コードを持つ漢字のうち、比較的良く使われる漢字を第一水準(2965字)、その他を第二水準(3388字)と区別してある。 例 漢字(全角文字)のJIS コードの例。 JIS コードの 16ビット列は、通例4けたの16進数の列として表記される。次がその例。左が16進数の4つ組、右がそのビット列。 中 --> 4 3 6 6 = (0100 0011 0110 0110) 村 --> 4 2 3 C = (0100 0010 0011 1100) 6

■Shift JISコード Microsoftによって考案された、日本で一番使用されている日本語文字コード。 主にMS-DOS、Windows、Mac OS、OS/2等のOSで広く使用される。パソコンで使われている。 半角カナを扱うことが可能。 ASCII部分は、7bitのJIS X 0201のローマ字で表現しているため、 ・バックスラッシュ(半角の\)⇒円記号(\) ・ティルダ(~)⇒オーバースコア( ̄)の違いがある。 7

■EUC-JPコード 主に UNIX、Linux で広く使用される。 情報棟の UNIX サーバでは EUC が使われている。そのため日本語をファイル名に使えない。 ■Unicode すべての文字を16ビット(2バイト)で表現し、1つの文字コード体系で多国語処理を想定した文字コード。 2バイト表記の場合、最大65536文字の表現の為、漢字圏の言語は全てをサポート出来ない問題がある。 JavaではUnicodeをデフォルトのデータ型としている。 情報棟端末ではUTF-8 を使っている。 8

情報表現の様々な側面(1) 情報の説明の仕方の違い 情報の表現のされ方の違い 手続き的表現 宣言的表現 記号表現 パターン表現 時間をおった手順を説明 宣言的表現 対象間の関係や対象の属性を説明 情報の表現のされ方の違い 記号表現 与えられた記号の集合と解釈するための規則体系 パターン表現 構成要素間の時空間パターン

記号の恣意性 これは本来、構造主義の用語である。別述。 車両通行禁止の標識(日本) すべての車両通行禁止(欧州) 二輪車以外の車両通行禁止(欧州) 記号の恣意性 これは本来、構造主義の用語である。別述。 記号表現と命題の対応付けは恣意的である

アナログ表現とディジタル表現の実際 量子化 観測値を離散的に取る 例 気温を 0.1 度単位ではかる 量子化 観測値を離散的に取る 例 気温を 0.1 度単位ではかる 標本化 観測の時間間隔を離散的にする  例 1時間ごとの気温をはかる (左の図)気温のアナログ表現-観測の標本化 (右の図)気温のディジタル表現-標本化と観測値の量子化 11 11

例 上限が 2000Hz の情報を復元するには、時間間隔 4000Hz 以上でサンプリング、標本化すれば、元のデータが復元できる。 ・標本化定理  標本化するときの周波数 を t とすると、 の周波数まで復元できる 。 をナイキスト周波数と呼ぶ。 例 上限が 2000Hz の情報を復元するには、時間間隔 4000Hz 以上でサンプリング、標本化すれば、元のデータが復元できる。 12

量子化と標本化の実際 情報の用途によって間隔の詳細度を決める 音楽CDのデジタル化 標本化 量子化 コンピュータディスプレイ装置 赤(R)緑(G)青(B)を混色したRGB形式を用いている 各々 8 ビット=256種類の異なる色で表現 256×256×256=16,777,216色を表示できる 音楽CDのデジタル化 人は通常 20Hzから、個人差があるが 15,kHz ないし20 kHz 程度の音を音として感じることができ、この周波数帯域を可聴域と いう。 . 標本化 標本化の基準:44.1kHz 1/44100=0.0000227秒間隔で音の情報を標本化 量子化 量子化のために16ビットを用いて、音の振幅を65536(2の16乗)個の段階に分割している。周波数の対数を 65536 分の一に分けているはずだと思う。(Weberの法則) 人間の視覚、聴覚の分解能を十分カバーできる詳細な量子化になっている 13 13

エイリアシング 対象にナイキスト周波数より高い周波数の周期関数が含まれている場合に,誤った関数が復元される現象をエイリアシングと呼ぶ (左の図)オリジナル画像 (右の図)エイリアシングが生じた例

標本化定理 f(t) が W以上の周波数成分を持たないとき での 時刻 から 観測値 もとの信号関数が一意に復元できる 15

2.4 ディジタル符号化 ハミング距離 二つの記号列 の間の距離を で定義する 16

[演習] ハミング距離が上の3つの公理を満たすことを示せ。 A=(0 0 1 0 1 1 1 1 0 0 0 1 1 1 0 0) B=(0 0 1 0 0 1 1 1 0 1 0 0 1 1 0 0) ハミング距離は3である。 数学上の距離の定義:以下の3つの性質を持つこと [演習] ハミング距離が上の3つの公理を満たすことを示せ。