Copyright © the University of Tokyo 文字化けの背景を知る
Copyright © the University of Tokyo 課題の概要 日本語の文字コードについて理解を深める MacOS( テキストエディット ) で利用可能なエ ンコーディング ( コード化方式 ) を確認する テキストエディットで文字化けの状況を調べる 自分の名前の 2 文字の文字コードを調べる 文字コードの違い ( 同じものか否か ) を推定する
Copyright © the University of Tokyo ドックにある Launchpad をクリッ ク テキストエディット(白枠内)を選択する テキストエディット – テキストエディットの起動
Copyright © the University of Tokyo テキストエディット – ファイル保存前の準備 テキストエディット中で自分の名前の 1 文字を 入力する ( 後でもう 1 文字入力する ) 「標準テキスト」ファイルにする ( 「フォーマット → 標準テキストにする」 )
Copyright © the University of Tokyo テキストエディット – 1つ目のファイルの保存 エンコーディングを指定してファイルを保存す る ( 「ファイル → 保存 … 」 ) まず UTF-8 で保存する エンコーディングと文字数がわかるファイル名に する (例: UTF1)
Copyright © the University of Tokyo Desktop に ”encoding” フォルダを作成 「場所」欄が「 Desktop 」になっていることを 確認 違う場合は右の をクリックして「 Desktop 」 を選ぶ 「名前」欄右の をクリック 保存先フォルダ設定 ウィンドウが表示される 左下の「新規フォルダ」を クリック ”encoding” と入力して 「作成」をクリック ” ” は入力しない テキストエディット – 作業用フォルダの作成
Copyright © the University of Tokyo テキストエディット – 「別名で保存」の仕方 「ファイル → 複製」で複製ファイルを作成 「ファイル → 保存 … 」で別ファイルとして保存で きる
Copyright © the University of Tokyo テキストエディット – 2つ目以降のファイルの保 存 エンコーディングを変えてファイルを保存す る UTF-8 良く利用される Unicode Mac OSMac OS の標準 WindowsWindows の標準 ISO 2022-JP いわゆる JIS コード EUCEUC コード Shift JISShift JIS コード 上記の 6 種類で試してみる
Copyright © the University of Tokyo テキストエディット – 2つ目以降のファイルの保 存 エンコーディングと文字数がわかるファイル名に する 選択可能な文字コードが少ないときは,「エン コーディングリストのカスタマイズ … 」を行なう
Copyright © the University of Tokyo テキストエディット – 2文字目の入力 「ファイル → 複製」でコピーを作成 名前の 2 番目の文字を入力する エンコーディングを変えてファイルを保存する 全部で 12(=6×2) 個のファイルができるはず
Copyright © the University of Tokyo 文字化けを試す (1) Safari で試す ファイル ( アイコン ) をドックの Safari にドラッグ する
Copyright © the University of Tokyo Firefox を開く ドックにある Launchpad をクリッ ク 右矢印キー、またはスワイプで右画面に移る Firefox (白枠内)を選択する
Copyright © the University of Tokyo 文字化けを試す (2) Firefox で試す ファイル ( アイコン ) をドックの Firefox にドラッグ する
Copyright © the University of Tokyo 文字化けを試す (3) ターミナルで試す ドックでターミナルをクリックして起動する 「 cd ディレクトリ」でディレクトリ ( フォルダ ) を移動し, 「 cat ファイル」で内 容を確認する
Copyright © the University of Tokyo 文字コードの推定 (1) hexdump コマンドで文字コードを 16 進表示 する 同じエンコーディングで, 1 文字のファイルと 2 文字のファイルとを比較することで, 2 文字 目の文字コードを推定できる ( はず …)
Copyright © the University of Tokyo 文字コードの推定 (2) 自分の名前の 2 文字が,どのようなコードに なっているか, 16 進表現と 10 進表現でまとめ よ 実際には同種の文字コードを利用している場合 があるので,同種と考えられるものを推定せよ 自信が得られない場合には, 3 文字目まで入力 したファイルを作ってみるのも良いだろう