文字コードについて(UTF-8とUTF-8Nの違い)
HTML・CSS, WEB制作の小技や機能 | 2012.02.15
インクルード用のphpファイルの文字コードをUTF-8で保存しておいたのですが、
開いた時に勝手にSJISに変わっていたので、文字コードについて調べてみました。
●文字コードUTF-8にはBOM付きとなしの2種類があります。
BOMつきがUTF-8、BOMなしがUTF-8N です。
●BOMがついていると「このファイルはunicodeですよ」と認識してくれます。
ですので、BOMがついていないUTF-8NはSJISに読み間違いをおこすことがあるようです。
対策としては、漢字やひらがなの2バイト文字が含まれていると読み間違いを起こしにくいようです。つまり、日本語のコンテンツの記載されているファイルであれば、よいのですが、インクル用のファイルなど、短いソースコードのみのファイルだと難しそうです。
ちなみに、cssファイルに2バイト文字がはいっている場合、
IEの6以前などの古いバージョンのブラウザでは、2バイトの文字以降のCSSがうまく読み込まれないバグがあります。
一方、UTF-8のデメリットとして、FLASHの読み込みに関するバグが発生する事もあるようです。
似ているようでちょっと違うUTF-8とUTF-8N。
ケースバイケースで使い分ける事が必要ですね。
【PR】使わなくなったパソコンはありませんか?パソコン無料回収