独習XML 第2章 XML文書の構成要素 2.1 XMLの文字と文字列 2.2 コメント XMLゼミ 独習XML 第2章 XML文書の構成要素 2.1 XMLの文字と文字列 2.2 コメント 藤井 丈明
2.1 XMLの文字と文字列 ・XMLで使用可能な文字:人間が読むことができる文字と、機械が識別する改行やタブなどの一部の基本的な制御コードだけを含む文書 テキスト文書にはイメージやサウンドなどの文字以外の情報は不可能
使用可能文字 水平タブ、改行、復帰、スペース、英数文字、記号や日本語などのUnicodeキャラクタに定義されている文字 <、>、&、‘、“は特別な目的以外使用不可 これらをテキスト中に使用する場合はエスケープシーケンスを用いる (詳細:p33表2.2) エスケープシーケンス:&と;の組み合わせ、<![CDATA[と]]>の組み合わせ(p46)
文字コードを使った文字表現 XMLでは文字そのものを扱う代わりに、文字コードを用いることも可能 例:Aの場合 10進数表現→‘A 16進数表現→)
エンコーディング XMLでは文字コードとして、原則としてUnicodeを用いる (UTF-8)(UTF-16) 日本語環境でよく使われる代表的な文字コード、エンコード方式はp37表2.3参照 ・encoding指定:XMLでは文字エンコーディングを指定できる デフォルトはUnicode(指定しなくても可)
XML宣言 XML文書の先頭にはその文書がXMLであることを示すXML宣言の記述が可能 <?xml version=‘1.0’ encoding=“UTF=16”?>
空白と名前 空白にはスペースキャラクタを使用(p39表2.4参照) 要素(タグ)や属性の名前の規則 名前の先頭には普通の文字、_のみ。以降は普通文字、数字、-、_、. :も使用可能であるが、仕様上好ましくない 名前に使用できる文字の詳細(p40表2.5参照) *XMLでは名前の大文字と小文字が区別されるので注意が必要 例:Papa≠papa
予約語 名前に使用できない文字がある 例:xml,XML,Xml,xML,…etc これは、XMLの仕様により予約されているからである ・その他の名前に使用できない文字 <? P45参照 <! P41,コメント参照
2.2 コメント XMLファイルでは、コメントの記述が可能
コメントの書き方 コメント <!-- --> 注意点 1:コメントの中に--を書くことはできない コメント <!-- --> 注意点 1:コメントの中に--を書くことはできない 2:コメントの中にコメントを入れ子として書くことはできない コメント内にタグ、-、- - - - は可能
コメントの位置 XML宣言後、タグの中でなければどこでも書くことができる しかしテキスト内にコメントを書くと、テキストがコメントで分断される しかしテキスト内にコメントを書くと、テキストがコメントで分断される ので注意が必要
課題 P33表2.2のエスケープ文字を使ってみる 作成したXML文書にコメントをつけてみる