MENU

無料相談

  1. HOME
  2.  > 
  3. サイト職人スタッフブログ
  4.  > 
  5. 文字化けって何?ホームページと文字コードとは?

サイト職人スタッフブログ

文字化けって何?ホームページと文字コードとは?

文字化けって何?ホームページと文字コードとは?

インターネット業務を行っている人間であれば、文字化けを経験したことがあるのではないかと思います。様々な媒体を閲覧していても、文字化けが発生してしまって読めないサイトというのもあるでしょう。

今回は、文字化けのことを説明する前に、文字コードとは何なのかについてと、なぜ文字化けが発生してしまうのかということなどについて解説していきたいと思います。

そもそも、文字コードとは何なのか?

インターネット媒体をリサーチしていると、たまに見かける文字化けですが、もしかしたらパソコンが壊れているのかもしれないと思った人もいるかもしれません。ホームページなのに読めなくなっているサイトは、文字化けが発生している可能性が高いです。この原因を知るためには、文字コードと呼ばれるものは何なのかについて知っておかなければなりません。文字コードとは、簡単に説明すれば、文字に数値を与えたもののことを表しています。

例えば、「そ」という文字があった場合、コンピュータはそのまま認識しているわけではありません。コンピュータが覚えられる情報で記憶されています。このように、一定のルールに基づいて情報をデータとして置き換えて記録することをエンコードと呼んでいます。しかし、コンピュータが記憶できる情報では、人間は、読むことができませんので、人間が読むことが可能な文字と対応させる必要があります。このとき、コンピュータが記憶できる情報にする必要があると言いましたが、これが文字コードなのです。

文字化けが発生してしまう理由とは

一般的なホームページ作成などをしていて、なぜ文字化けが発生してしまうかご存知ですか?

文字化けという現象を知っていたとしても、なぜ文字化けが発生するのかについては、知らない人が多いと思います。文字化けというのは、HTMLファイル自体の文字コードとブラウザによって解釈された文字コードが異なる時に発生するのです。分かりやすく説明すれば、UTF-8で保存されたHTMLファイルにもかかわらず、Shift_JISだと思って表示してしまった場合に、文字化けが発生するということです。

しかし、なぜこのように認識の違いを起こしてしまうのか気になるのではないかと思います。一般的なWebブラウザでは、様々な過程を経て、この文字コードであれば、○○の文字コードだろうと解釈して、表示していますので、この解釈を間違えてしまうと、文字化けした状態で画面に表示されてしまうということです。しかし、一般的な利用をしていれば、Webブラウザは、正しく情報を認識してくれますので、文字化けが発生することはありません。それでも文字化けが発生してしまうのは、制作者がしっかりとした指定をしていないことによって、誤って認識されてしまうということです。

文字化けを発生させないようにする対策とは?

上記で説明したように、文字化けを発生させないようにするためには、Webページ制作者が、正しく文字コードを指定することによって、ブラウザに正しく文字コードを解釈させることだと説明しました。文字化けを発生させたくないのであれば、HTMLファイルがどのような文字コードで保存されているのかということを理解しておく必要があります。あなたが利用しているエディタによって、文字コードが変化しますので、しっかりと調べておきましょう。

この点をしっかりと管理していないと文字化けを発生させてしまう可能性があります。自分のHTMLファイルについて、調べることが完了したら、HTMLファイル内で指定されている文字コードを調べていきます。これを調べることでどのようなことがわかるのかというと、自分のHTMLファイルの文字コードというのは、これですと伝える意味があるのです。このように自分のHTMLファイルとHTML内で指定する文字コードを調べることをしっかりと行っていれば、基本的に文字化けが発生することはないでしょう。

基本的な文字コードについて解説

一般的に見る文字コードについて説明しますが、少し難しい内容かもしれません。上記で説明した内容は最低限理解しておけば、文字化けは解決することができますので、上記の内容だけでも理解しておきましょう。

1.シフトJISコード

ASCIIのコード体系の文字とまぜて利用できるようになっている日本語の文字コードとなります。漢字やひらがなやカタカナなどを利用することができます。

2.EUC

拡張型UNIXコードとも呼ばれており、UNIXというOS上で、非常に利用されている日本語文字コードとなっています。

3.Unicode

世界中の文字コードを統一してしまおうということで、様々な国の文字を1つのコード体系で表すために作成された文字コードとなっています。

最後に

今回、文字化けについて説明しましたが、今まで解決できなかった人も自分で調べて解決するきっかけになったのではないかと思います。保存したファイルと表示させたいファイルを同一のものとして認識させてあげたら、基本的に解決することができますので試してみてください。

PAGETOP