文字の表現.

Slides:



Advertisements
Similar presentations
2009/11/10 10 進数と r 進数を相互に変換できる コンピュータのための数を表現できる 2進数の補数を扱える コンピュータにおける負の数の表現を説明で きる コンピュータでの演算方法を説明できる 文字や記号の表現方法を示せる 第7回 今日の目標 § 2.2 数の表現と文字コード.
Advertisements

7章 情報の表現と基礎理論. 数の表現(書き方) 「数」と「数の書き方」をわけて考える 「数の書き方」と,「数そのものの性質」は別のもの 例:13 は素数・・・”13”という書き方とは無関係 ここでは書き方(表現方法)について考える 567.
Outlook メール文字化けの原因と対策 Exchange Server 環境編. 目次はじめに文字化けのよくある原因と回避策 1. A:半角英数字、ヨーロッパ言語などが混在した 文字化け B : 送信済みメールの宛先や CC の文字化け 2. 返信、転送時の、ユーザー名や件名の文字化け 3. 日本語が半角英数字に文字化け.
事業計画書 株式会社 OGF 小野 勝康. 目標 1.3 × 4キーボードでデバイス・ドライバを開発し モバイル環境における入力方法の改善 US パテント、 JP パテント、 CN パテント取得済み 3000 万の投資で 5000 万の利益( 5 年間) 2. フルキーボードでアクセシビリティの改善.
2.5 プログラムの構成要素 (1)文字セット ① ASCII ( American Standard Code for Interchange ) JIS コードと同じ ② EBCDIC ( Extended Binary Coded Decimal for Information Code ) 1.
基本編の用語説明 その2 エディタと日本語入力 エディタ  エディタ (editor) :文書を作成、編集する アプリケーションソフトウェア  教育用計算機システムのエディタは、 テキストエディット テキストエディット  基本的な編集方法はここここ  カーソル:文字が入力される位置を表している目印.
Copyright © the University of Tokyo 文字化けの背景を知る. Copyright © the University of Tokyo 課題の概要 日本語の文字コードについて理解を深める  MacOS( テキストエディット ) で利用可能なエ ンコーディング ( コード化方式.
Copyright © the University of Tokyo 文字化けの背景を知る. Copyright © the University of Tokyo 課題の概要 日本語の文字コードについて理解を深める  MacOS( テキストエディット ) で利用可能なエ ンコーディング ( コード化方式.
基本情報技術概論(第2回) 埼玉大学 理工学研究科 堀山 貴史
プログラミングとは Q.プログラムとは何か? A.コンピュータを制御するための,コンピュータに対する命令(指示)の集まり.
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
コンピュータの予備知識 ネットワークシステムⅠ 第4回.
情報A 第11回授業 04情報のディジタル化 対応ファイル:12exp10.xls(前回)
富山大学 公開講座 2008 「QRコードを作ろう!」 ~ QRコードを作ろう! ~.
文字列検出ツール "istrings" の使い方
「情報」 (中村) オリジナル PPT (2010/05/07) 1 1.
授業展開#4 2進数世界の数値と文字.
2004, Spring term, Yutaka Yasuda
須賀 友也 神戸大学 理学研究科 地球惑星科学専攻 M1
JEPA「文字図形共有基盤」調査検討分科会 黒田信二郎 2011年11月17日
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
文字のディジタル化 Copyright(C)2009 Tsutomu Ohara All rights reserved.
情報工学基礎(改訂版) 岡崎裕之.
コードの歴史 ASCII(American Standard Code for Information Interchange)  ANSI ISO 646 = 95文字のラテン文字 アルファベット+数字+特殊文字 制御コード: LF, CR などの表示制御と   ACK,DEL などの通信制御 、など.
文字のディジタル化 Copyright(C)2009 Tsutomu Ohara All rights reserved.
地理情報システム論 第3回 コンピュータシステムおける データ表現(1)
第2章 ソフトウェアの基礎知識 電子制御設計製図Ⅰ    2010年5月11日 Ⅲ限目.
プログラミングとは Q.プログラムとは何か? A.コンピュータを制御するための,コンピュータに対する命令(指示)の集まり.
コンピュータ基礎実習上級 #11画像ファイルと文字のフォーマット
第2章 ソフトウェアの基礎知識.
心理学情報処理法Ⅰ コンピュータにおけるデータ表現 マルチメディアとコンピュータ.
文字化けの背景を知る.
プログラミング言語論 プログラミング言語論 プログラミング言語論 演習1 解答と解説 演習1解答と解説 1 1.
2012年度 情報数理 ~ QRコードを作ろう!(1) ~.
2008年度 情報数理 ~ QRコードを作ろう!(1) ~.
コンピュータリテラシー 広島工業大学 知的情報システム工学科 張 暁華 2003年.
Outlook メール文字化けの原因と対策
1.コンピュータと情報処理 p.14 第1章第1節 1.わたしたちの生活と情報技術 情報機器の発展 情報機器は,アナログデータから
報告4:蔵書評価における文字コード問題について
情 報 A ー ディジタル化のしくみ ー.
2010年度 情報数理 ~ QRコードを作ろう!(1) ~.
情報機器の発達とディジタル化 第2節 情報のディジタル化
文字化けの背景を知る.
文字化けの背景を知る.
オントロジーを使用した プログラム開発支援システムの提案
図書館システムの歴史と日本語処理 紅林 徹也 ~ 大規模目録データベース ~ 株式会社 日立製作所 公共システム事業部
芝野耕司 ISO/IEC JTC1/SC2 (Coded Character Sets)委員長 東京外国語大学
コンピュータを知る 1E16M009-1 梅津たくみ 1E16M017-8 小沢あきら 1E16M035-0 柴田かいと
図書館システムと日本語との 格闘の歴史(過去、現在、未来) -CALISを中心にして-
プログラミング応用 printfと変数.
文字コード 情報処理3 今井孝明.
独習XML 第2章 XML文書の構成要素 2.1 XMLの文字と文字列 2.2 コメント
条件分岐と繰り返し.
第4回 コンピューティングの要素と構成 平成22年5月10日(月)
Ibaraki Univ. Dept of Electrical & Electronic Eng.
文字エンコーディング 2010年7月.
第2章 ソフトウェアの基礎知識 電子制御設計製図Ⅰ    2010年5月19日 Ⅱ限目.
文字のディジタル化 Copyright(C)2009 Tsutomu Ohara All rights reserved.
暗号技術 ~暗号技術の基本原理~ (1週目) 情報工学科  04A1004 石川 真悟.
2013年度 プログラミングⅡ ~ 計算してみよう ~.
2015年度 プログラミングⅡ ~ 計算してみよう ~.
基本情報技術概論(第2回) 埼玉大学 理工学研究科 堀山 貴史
地理情報システム論(総)/ 国民経済計算論(商)
日本語独特のL10N問題とは? 各社仕様の拡張文字 複数の符号化 規格の混乱など Unicodeとのマッピング
情報コミュニケーション入門b 第2回 Part1 ハードウェアとソフトウェア
情報コミュニケーション入門b 第2回 Part1 ハードウェアとソフトウェア
オペレーティングシステム 作成 T21R003 荏原 寛太.
CADシステムとソフトウェア 電子制御設計製図Ⅰ    2009年4月28日 Ⅲ限目.
情報スキル入門 第7週 データの取り扱いと表現.
日本語プログラミング Vs ASCIIプログラミング 中 博俊 vs takeshik.
Presentation transcript:

文字の表現

※ 実際にコンピュータで使われているマッピングとは異なります 文字を2進数で表現する コンピュータは文字データを扱うことができる 例えば,以下のように文字を2進数に対応付け(マッピング)すれば,文字を2進数として扱うことができる 文字などの情報をコンピュータで処理できる符号(2進数)で表現しなおすことをコード化(符号化)という 文字と符号の対応を表現した表を文字コード表という 文字 A B C D 2進数 00 01 10 11 ※ 実際にコンピュータで使われているマッピングとは異なります

アルファベットの符号化 ASCIIコード ASCIIコード 文字情報を7桁の2進数に符号化 上側の0~7の16進数は上位3桁,左側の0~Fの16進数は下位4桁を表現(例:A=41(16)=1000001(2)) CRやDEL等はコンピュータに特定の機能を実行させる役割が割り当てられた機能コード BS(Back Space)は「一文字後退」 CR(Carriage Return)は「行頭復帰(カーソルを,カーソルが位置する行の先頭に移動させる)」 日本語はもっと多くの文字があるので,7桁では表現できない

ASCIIコード表 1 2 3 4 5 6 7 8 9 Null DLE 空白 @ P ` p SOH DC1 ! A Q a q STX 1 2 3 4 5 6 7 Null DLE 空白 @ P ` p SOH DC1 ! A Q a q STX DC2 " B R b r ETX DC3 # C S c s EOT DC4 $ D T d t ENQ NAK % E U e u ACK SYN & F V f v BEl ETB ' G W g w 8 BS CAN ( H X h x 9 HT EM ) I Y i y LF SUB * : J Z j z VT ESC + ; K [ k { FF FS , < L \ l ¦ CR GS - = M ] m } SO RS . > N ^ n ~ SI US / ? O _ o DEL

日本語の符号化 (マルチバイトコード系) 漢字を含む日本語は65536通りを区別できる16桁以上の2進数で表現する JIS X 0208という規格で,計6879個の文字(ひらがな,カタカナ,漢字など)が規定されている よく使われているJIS X 0208に基づいた符号化方式は以下の3種類 ISO-2022-JP(JIS)・・・電子メールで主に使われている Shift_JIS・・・Windowsをはじめ多くのパソコンで使われている EUC-JP・・・Unixで主に使われている

Unicode 世界中の主要な言語の多様な文字を1つの文字コード体系で取り扱い,多言語表記を可能にする JIS X 0208に基づくShift-JISやEUC-JPは日本専用 全世界の文字を2進数16桁で表現しようと開始された 符号化方式としては以下のようなものがある UCS-2,UCS-4 UTF-7,UTF-8,UTF-16,UTF-32 公式ホームページ:http://unicode.org 中国語や日本語,韓国語で使われる漢字で字形が似ている文字を同一とみなす(統合作業)などの問題点もある