文字エンコーディング 2010年7月
目次 文字セット 文字コード 文字エンコーディング
文字セット 漢字、ひらがな、カタカナ、英数字、記号などの文字の集まりのこと 「文字集合」とも呼ばれる 国や言語によってさまざまな文字セットがある 文字セットによって含まれる文字が異なる JIS漢字コード – ひらがなや漢字など ASCII – 英数字、記号など Unicode – 世界の主要言語の文字
文字セット(例) ASCII Unicode A a 1 “ い JIS漢字コード う あ ア い A あ a é う 川 И 川 ア 1 翻 翻 山 “ 山 ɛ
文字コード それぞれの文字や記号に割り当てられた固有の数字のこと 文字セットによって、同じ文字に対して異なる数字が割り当てられる場合がある JIS漢字コード ASCII Unicode あ 2422 (存在しない) 3042 ア 2522 30A2 A(半角) 41 0041 (16進数で表記)
文字エンコーディング 文字コードをコンピュータが利用できるデータに変換(符号化)する方式 「文字符号化方式」とも呼ばれる JIS漢字コードおよびASCIIを符号化する方式 Shift_JIS EUC-JP ISO-2022-JP Unicodeを符号化する方式 UTF-8 UTF-16
文字エンコーディング(例) JIS漢字コード+ASCII Unicode 文字コード Shift_JIS EUC-JP ISO-2022-JP あ 2422 82A0 A4A2 ア 2522 8341 A5A2 A 41 文字コード UTF-8 UTF-16 あ 3042 E38182 ア 30A2 E382A2 A 41 0041
注意 この資料は文字コードの概念を説明するためのものです 分かりやすく説明するため、詳細を割愛しています 詳細についてはウィキペディアの下記のページを参照してください 「文字コード」 「文字集合」 「文字符号化方式」