(要約) httpヘッダーには文字コードの指定がなく、html本文にシフトJISとあるのに、 その実態は文字コードにUnicodeを利用しているおバカサイトを見つけました。 Unicodeって半角文字に00のバイトが含まれますから通信に馴染まないんですけどね。 http://c.statcounter.com/4440886/0/1c5b0b72/0/ 人閲覧者接続情報 http://www.robtex.com/ipinfo.gifhttpヘッダーには文字コードの指定がなく、html本文にシフトJISとあるのに、 その実態は文字コードにUnicodeを利用しているオーバッカサイトを見つけました。 そのサイトのソースコードを確認すると文字化けを起こしたのです。 このソフトでは文字コードの自動判別の場合、 httpヘッダーに文字コードの指定があればその文字コード指定に従いますけど、 指定が無ければhtml本文にある文字コード指定を自動的にピックアップして 文字コードの判別をします。 一般にはJISでもシフトJISでも、あるいはEUCやUTF-8でも、 英数字に対応する文字コードは1バイト系でAsciiコードと一致するのですけど、 Unicodeは全部の文字が同じバイト数で構成されますので、 バイト単位で見ると文字コード0を含むんです。 そのためUnicodeは半角文字でさえもAsciiコードと異なりますから、 文字コードの自動判別ができませんでした。 仕方ないのでページをダウンロードして確認すると、やはりUnicodeなんですけどねぇ。。。 改めてUnicodeでページのソースコードを読んでみると。。。 文字コードはUnicodeなのにも関わらず、Shift_JISって書いてあるんですよ。 <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> 文字コードをUnicodeとして保存するソフトウェアは少ないはずですし、 さらにはデフォルトでUnicodeとして保存するソフトウェアは皆無に近いでしょうね。 知ったかぶりしてUnicodeで保存し、混乱を撒き散らしているだけとしか思えませんでした。
|

>
- エンターテインメント
>
- サブカルチャー
>
- お笑い&ジョーク






